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Geleitwort 



Seit Anfang der 70er Jahre hat die praktische Bedeutung von Conjoint- Analysen 
als ein Instrument zur Messung von Nachfragerpräferenzen kontinuierlich zuge- 
nommen. In den letzten 10 Jahren sind verstärkt Weiterentwicklungen traditio- 
neller Conjoint- Analysen vorgeschlagen worden, insbesondere in Form von com- 
putergestützten hybriden Conjoint- Analysen sowie choice-based Conjoint- 
Analysen. Hybride Conjoint-Analysen verbinden direkte und indirekte Verfahren 
der Präferenzmessung miteinander. Die Auskunftspersonen geben hierbei zu- 
nächst im direkten Befragungsteil (Self-Explicated-Methode) isoliert ein direktes 
Urteil zur Wichtigkeit von Eigenschaften und deren Ausprägungen ab (z.B. Prä- 
ferenzurteile über einzelne Produkteigenschaften bzw. deren Ausprägungen) und 
beurteilen dann im indirekten Befragungsteil ausgewählte Eigenschaflskombina- 
tionen bzw. Stimuli (z.B. globale Präferenzurteile hinsichtlich ganzheitlich be- 
schriebener Produkte). Hybride Conjoint-Analysen eignen sich insbesondere 
dann, wenn eine hohe Anzahl von Eigenschaften auf individueller Ebene zu un- 
tersuchen sind. Die meisten praktischen Anwendungen hybrider Conjoint- 
Analysen hat die Adaptive Conjoint Analysis (ACA) erfahren. Trotz ihrer weiten 
Verbreitung und der prinzipiellen Vorteilhaftigkeit hybrider Verfahren weist die 
ACA verschiedene Schwachpunkte auf (z.B. die wiederholte Verwendung von 
Paarvergleichen). 

Vor diesem Hintergrund besteht das Ziel der vorliegenden Arbeit darin, neue 
computergestützte hybride Conjoint-Analysen zu entwickeln und deren Validität 
gegenüber bestehenden Ansätzen auf Basis einer breit angelegten empirischen 
Untersuchung zu analysieren. Die neu entwickelten Conjoint-Analysen beinhal- 
ten zum einen (aufbauend auf einem Ansatz von Srinivasan und Park 1997) die 
Customized Computerized Conjoint Analysis (CCC) und zum anderen die 
Choice-Oriented Individualized Conjoint Analysis (CHIC). Als Referenzpunkte 
für die Validitätsprüfung werden die weit verbreitete ACA sowie die Self- 
Explicated-Methode gewählt. Self-Explicated-Methoden bieten sich als Ver- 
gleichsbasis an, da sie prinzipiell für die betrachtete Problemstellung einer indi- 
viduellen Präferenzmessung bei vielen Eigenschaften geeignet sind und von der 
Handhabung her Kosten- sowie Zeit- und Komplexitätsvorteile aufweisen. 
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Die vorgenommenen empirischen Validitätsprüfungen stellen - unterstützt durch 
das Marktforschungsunternehmen IPSOS Deutschland - eine der umfangreichsten 
wissenschaftlichen Untersuchungen im Bereich der Conjoint- Analyse dar. Im 
Einzelnen werden die vier Kriterien diskriminierende Validität, interne Validität, 
Prognosevalidität und externe Validität überprüft. Hervorzuheben ist die Unter- 
suchung der externen Validität, bei der für jedes Verfahren prognostizierte 
Marktanteile mit realen Marktanteilen des GfK-Handelspanels verglichen wer- 
den. 

Die Befunde sind bemerkenswert. Zum einen können die beiden neuen Verfahren 
CCC und CHIC gegenüber dem bisherigen Standard ACA mindestens ebenbürti- 
ge Ergebnisse erzielen. Damit wird die insbesondere in der Praxis weite Ver- 
breitung der ACA in Frage gestellt. Zum anderen weisen die Self-Explicated- 
Methoden keine gravierenden Nachteile gegenüber sämtlichen hybriden Con- 
joint- Analysen im Hinblick auf die untersuchten Validitätskriterien auf. Auch 
wenn sicherlich noch weitere Forschung notwendig ist, so deuten die Befunde 
darauf hin, daß sich methodischer und datenerhebungstechnischer Aufwand nicht 
zwingend lohnen muß. 

Die Lektüre des Buches kann nicht nur aufgrund dieser interessanten Ergebnisse 
und der neu entwickelten State-of-the-Art-Conjoint- Analysen empfohlen werden. 
Darüber hinaus ist das Buch sowohl Wissenschaftlern als auch interessierten 
Praktikern als ein Einstieg in die Methoden zur Präferenzmessung nahezulegen. 
Es wird ein sehr gut lesbarer und kompakter, gleichzeitig jedoch umfassender 
Überblick in die Thematik der Messung von Präferenzen gegeben. Ich bin über- 
zeugt, daß diese Arbeit eine weite Verbreitung in Theorie und Praxis finden wird. 



Prof Dr. Henrik Sattler 
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Vorwort 



Kaum ein anderes Verfahren ist zentraler Gegenstand so vieler Publikationen und 
Studien wie die Conjoint-Analyse. Fast zu jedem einzelnen Ablaufschritt des 
Verfahrens liegen zahlreiche Untersuchungen vor, die alternative methodische 
Vorgehensweisen vorschlagen oder empirisch miteinander vergleichen. Doch 
trotz dieser umfangreichen und umfassenden Diskussion verschiedener Verfah- 
rensvarianten scheint sich ein Verfahren, die Adaptive Conjoint Analysis (ACA), 
nahezu als Standardverfahren sowohl in der Wissenschaft als auch in der Praxis 
zu etablieren. Vor dem Hintergrund der umfassenden Diskussion des methodi- 
schen Vorgehens bei der Conjoint-Analyse stellt sich jedoch die Frage, ob sich 
mit der ACA tatsächlich die geeignetste Verfahrens Variante durchgesetzt hat oder 
die Dominanz des Verfahrens maßgeblich auf das Vorliegen eines integrierten 
Softwarepakets zurückgeführt werden muß. Die vorliegende Arbeit soll eine 
Antwort auf diese Frage geben. Hierfür werden mit der Customized Computeri- 
zed Conjoint Analysis (CCC) und der Choice-Oriented Indiviualized Conjoint 
Analysis (CHIC) neue computergestützte Conjoint-Varianten entwickelt und im 
Rahmen einer empirischen Validitätsprüfung direkt mit der ACA verglichen. 

Meinem Doktorvater und akademischen Lehrer, Herrn Prof. Dr. Henrik Sattler, 
verdanke ich sehr viel. Er hat mir dieses spannende Dissertationsthema vorge- 
schlagen, war unermüdlich in seiner Diskussionsbereitschaft und hat meine Ar- 
beit und mich persönlich zu jeder Zeit unterstützt. Darüber hinaus hat er es mir 
ermöglicht, am Aufbau eines neu gegründeten Lehrstuhls an einer sehr jungen 
Fakultät in den neuen Bundesländern mitzuwirken. Ich konnte dadurch Erfahrun- 
gen in vielerlei Hinsicht sammeln, für die ich mindestens genauso dankbar bin. 
Für die Übernahme des Zweitgutachtens zu meiner Arbeit gilt mein Dank Herrn 
Prof. Dr. Johannes Ruhland. 

Die empirische Überprüfung der entwickelten Conjoint- Verfahren wäre in dem 
Umfang ohne die Kooperation mit der IPSOS Deutschland nicht möglich gewe- 
sen. Für die Durchführung der gesamten Datenerhebung, die Bereitstellung aller 
Daten und für die sehr gute und unkomplizierte Zusammenarbeit möchte ich 
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mich insbesondere bei Frau Claudia Keck und Herrn Harald Hasselmann bedan- 
ken. 

Die Arbeit entstand im Rahmen meiner Tätigkeit am Lehrstuhl für Marketing an 
der Friedrich-Schiller-Universität Jena. Während dieser Zeit arbeitete ich Tür an 
Tür mit meinen Kollegen Dr. Grit Zatloukal und Dr. Olaf Ernst. Ihnen möchte ich 
an dieser Stelle besonderen Dank aussprechen. Mit ihnen habe ich die spannende 
Aufbauphase eines neu gegründeten Lehrstuhls erlebt und gemeistert. Die gute 
Atmosphäre an unserem Lehrstuhl wurde dabei wesentlich von Constanze Neu- 
kirch geprägt. Auch bei ihr möchte ich mich ganz herzlich bedanken. 

In den unterschiedlichen Phasen der Arbeit erfuhr ich Hilfe von zahlreichen Sei- 
ten. Allen voran gilt mein Dank Simone Martin, ohne deren nie endende Unter- 
stützung die neuen Verfahren in der Form nicht entwickelt worden wären. Ich 
habe heute noch ein schlechtes Gewissen, weil sie für die Fertigstellung der Pro- 
grammierarbeiten auf einen bereits gebuchten Surf-Urlaub verzichtet hat. Ge- 
meinsam mit Thomas Niekler habe ich die Verfahren in einem umfangreichen 
Pretest auf ihre Anwendbarkeit getestet. Auch bei ihm möchte ich mich bedan- 
ken. Frau Colette Friedrich hat mir immer wieder geholfen, die Auswertung der 
individualisierten Datensätze zu automatisieren. Ohne sie hätten so manche Aus- 
wertungsschritte um ein vielfaches länger gedauert. Die ersten Versionen der Ar- 
beit wurden mehrfach Korrektur gelesen. Hierfür möchte ich mich bei Dr. Kath- 
rin Börner, Dipl.-Volksw. Ines Müller, Prof Dr. Maria Rumpf und Dr. Michel 
Clement ganz herzlich bedanken. Sie alle haben durch ihre kritische Durchsicht 
und konstruktiven Hinweise zur Verbesserung der Arbeit beigetragen. 

Diese Arbeit wäre nie entstanden, wenn mich meine Eltern nicht stets darin ge- 
stärkt und ermutigt hätten, meinen Weg zu gehen. Mein Mann Niels war immer 
für mich da. Er hat alle Höhen und Tiefen der Arbeit miterlebt und mich auch des 
öfteren daran erinnert, daß sich die Welt nicht nur um die Conjoint- Analyse 
dreht. Ihm und meinen Eltern danke ich von ganzem Herzen und widme ihnen 
diese Arbeit. 



Susanne Hensel-Börner 
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1 Problemstellung und Aufbau der Arbeit 



1.1 Problemstellung 

Mit jeder Kaufentscheidung treffen Konsumenten die Wahl für oder gegen ein 
bestimmtes Produkt. Auch wenn das Produkt damit letztendlich als Ganzes beur- 
teilt wird, hängt diese Kaufentscheidung maßgeblich davon ab, welche Eigen- 
schaften bei diesem Produkt in welcher Ausprägung auftreten. Damit wird ein 
Produkt nach Brockhoff (1999) als Bündel von Eigenschaften definiert, deren 
Kombination vom Anbieter des Produkts vorgenommen wird. Diese Definition 
beschränkt sich dabei nicht nur auf die physischen Eigenschaften eines Produkts, 
sondern kann auch auf Pakete von Produkten oder Dienstleistungen erweitert 
werden.’ So hängt beispielsweise die Entscheidung für ein Mobilfunkangebot 
nicht nur von den Eigenschaften des Endgerätes ab, sondern auch von den Ta- 
rifstrukturen und Vertragsbedingungen des jeweiligen Netzbetreibers. Die Kauf- 
entscheidung der Konsumenten liefert für den Anbieter allerdings erst nachträg- 
lich die Information, ob seine vorgenommene Kombination der Produkteigen- 
schaften den Anforderungen der Kunden entspricht oder nicht. Eine solch ver- 
spätete Information über den Erfolg eines Produkts ist vor allem im Fall eines 
Mißerfolges mit hohen finanziellen Verlusten verbunden und kann die Wettbe- 
werbsfähigkeit eines Unternehmens gefährden. 

Für eine erfolgreiche Kombination der Produkteigenschaften ist Voraussetzung, 
daß den verantwortlichen Produkt-Managern bereits vor der Produkteinführung 
Informationen über die Bedeutung der einzelnen Eigenschaften eines Produkts 
für die Konsumenten vorliegen. Denn erst wenn bekannt ist, welche und in wel- 
chem Ausmaß einzelne Produkteigenschaften bei der Kaufentscheidung wichtig 
sind, können die Produkte und Angebote darauf ausgerichtet und der Produkter- 
folg entscheidend beeinflußt werden. Beispielsweise wird sich ein Kunde, für den 
die mobile Erreichbarkeit im gesamten Bundesgebiet unerläßlich ist, nicht für 
einen Mobilfunkanbieter entscheiden, der nur eine eingeschränkte Flächendek- 
kung bietet. Die Präferenzstruktur dieses Kunden ist dadurch gekennzeichnet, daß 



Vgl. Brockhoff (1999), S. 13. 
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die Flächendeckung des Netzanbieters ein kaufentscheidendes Kriterium dar- 
stellt. In diesem Beispiel wird deutlich, daß die Präferenzstrukturen der Konsu- 
menten nicht wie die Kaufentscheidung nur Auskunft darüber geben, ob ein Pro- 
dukt letztendlich gekauft wird, sondern sie geben Antworten auf die Frage, war- 
um ein Produkt gekauft wird oder eben nicht. Die Aufgabe der Marktforschung 
ist daher, Methoden bereitzustellen, anhand derer die Präferenzstrukturen der 
Nachfrager erfaßt und abgebildet werden können. 

Eine der bedeutendsten Methoden zur Messung von Nachfragerpräferenzen ist 
die Conjoint-Analyse. Sie zählt zweifelsohne zu den populärsten multivariaten 
Analysemethoden im Marketing. Dies gilt sowohl aus Sicht der Wissenschaft als 
auch für die kommerzielle Anwendung des Verfahrens in der Marketing-Praxis. 
Die Conjoint-Analyse ist mittlerweile fester Bestandteil in jedem Lehrbuch der 
Marktforschung und ist in zunehmendem Maße Forschungsgegenstand zahlrei- 
cher Veröffentlichungen in wissenschaftlichen Zeitschriften.^ Gleichzeitig hat 
kaum ein anderes Analyseinstrument, das in der wissenschaftlichen Forschung 
entwickelt wurde, eine so weite Akzeptanz und Verbreitung in der Praxis gefun- 
den. Bereits Mitte der achtziger Jahre schätzen Wittink und Gattin (1989) die 
Zahl der kommerziellen Anwendungen allein in den USA auf 400 im Jahr.^ Für 
Europa konnten in dem Zeitraum von 1986 bis 1991 nahezu 1000 von Marktfor- 
schungsunternehmen durchgefuhrte Conjoint-Studien nachgewiesen werden."^ 
Mittlerweile dürfte diese Zahl noch um ein Vielfaches höher liegen.^ 

Grundidee der traditionellen Conjoint-Analyse ist es, die Präferenzstruktur von 
Konsumenten auf indirektem Weg zu ennitteln. Die Konsumenten werden nach 
Präferenzurteilen für ganzheitlich beschriebene Produktalternativen gefragt. Es 
ist die Aufgabe des Marktforschers, auf Basis der erhobenen Präferenzen den 
Nutzenbeitrag jeder einzelnen Produkteigenschaft zum Gesamturteil zu ermit- 
teln.^ Diese Zerlegung der erhobenen Gesamturteile in einzelne Teilkomponenten 



^ Vgl. Voeth (1999), S. 154. 

^ Vgl. Wittink/Cattin (1989), S. 92. 

Vgl. Wittink/Vriens/Burhenne (1994), S. 43. 
^ Vgl. Voeth/Hahn ( 1 998), S. 1 1 9 f 
^ Vgl. Green/Srinivasan ( 1 978), S. 1 04. 
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wird auch als dekompositionelles^ Vorgehen bezeichnet und stellt das wesentli- 
che Merkmal der Conjoint- Analyse dar. Immer häufiger, vor allem bei Relevanz 
vieler Produkteigenschaften, stößt die traditionelle Conjoint- Analyse allerdings 
an ihre Grenzen. Die ganzheitliche Beschreibung der Produktkonzepte - entspre- 
chend der realen Kaufentscheidung - erhöht zwar den Realitätsbezug der Aufga- 
benstellung, kann aber insbesondere bei mehr als 6 Produkteigenschaften auf- 
grund einer kognitiven Überlastung der befragten Personen zu Validitätsproble- 
men führen.^ Da in praktischen Anwendungen häufig eine größere Anzahl an 
Produkteigenschaften untersucht werden soll, sind vor allem für solche Anwen- 
dungen hybride Verfahren entwickelt worden.^ Hybride Verfahren kombinieren 
einen kompositionellen und einen dekompositionellen Befragungsschritt mitein- 
ander. Die Auskunftspersonen geben hierbei im kompositioneilen Teil, auch Self- 
Explicated-Methode genannt, ein direktes Urteil über die Wichtigkeit der Eigen- 
schaften und deren Ausprägungen ab.*® In einem zweiten, dekompositionellen 
Schritt werden ausgewählte Eigenschaftskombinationen wie bei einer traditio- 
nellen Conjoint- Analyse bewertet. Die Einfachheit der Self-Explicated-Methode 
wird mit der realistischeren Aufgabe der Conjoint- Analyse kombiniert. Ziel ist es, 
die Vorteile beider Verfahren zu nutzen und die Komplexität der Aufgabenstel- 
lung für die Probanden zu reduzieren.** Abbildung 1-1 beschreibt den Zusam- 
menhang der beschriebenen Ansätze der Präferenzmessung. 



^ Der Begriff „dekompositioneil“ wurde von dem englischen Verb „to decompose“ (deutsch: 
„zerlegen“) abgeleitet. 

^ Green/Srinivasan (1990), S. 8 f. 

^ Vgl. Green (1984), S. 156. 

*® Die Self-Explicated-Methode geht als kompositionelles Verfahren genau umgekehrt vor 
wie die Conjoint-Analyse. Statt globaler Gesamturteile bezüglich mehrerer Produktalter- 
nativen zu erheben, werden die Probanden direkt nach der Wichtigkeit der einzelnen Ei- 
genschaften und deren Ausprägungen gefragt. Nachträglich werden diese Einzelurteile für 
die betrachteten Eigenschaften vom Marktforscher zu einem Gesamturteil für alternative 
Produkte kombiniert (vgl. Hoepfl/Huber (1970), S. 408; Srinivasan (1988), S. 296). 

" Vgl. Green (1984), S. 156. 
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Abbildung 1-1: Ansätze zur Präferenzmessung 



Methoden der 
Präferenzmessung 



kompositioneil 

(Self-Explicated- 

Methode) 

Hybride 

Verfahren 

dekompositionell 
(Conjoint- Analyse) 



Quelle: Eigene Erstellung 



Mit der Entwicklung hybrider Verfahren kommt auch der computergestützten 
Datenerhebung eine immer größere Bedeutung zu. Computergestützte Interviews 
können, insbesondere durch Anpassung des Interviewablaufs an vorangegangene 
Antworten, die Effizienz der Datenerhebung erhöhen.’^ Dies zeigt sich auch dar- 
an, daß die mit Abstand am weitesten verbreitete Form der hybriden Conjoint- 
Analyse die von Johnson (1987) in Verbindung mit Sawtooth Software entwik- 
kelte Adaptive Conjoint Analysis (im folgenden: ACA) ist. Sie stellt die bisher 
einzige kommerzielle Conjoint-Software dar, die sich durch einen adaptiven In- 
terviewablauf auszeichnet. Der Präferenzbildungsprozeß wird dabei auf Basis 
individuell wichtiger Merkmale analysiert und bietet damit vor allem den Vorteil, 
Studien mit einer großen Anzahl von Eigenschaften durchfuhren zu können.’"^ 
Nicht zuletzt die komfortable Integration von Datenerhebung, Auswertung und 
Marktsimulation in einem Softwarepaket begründet die (zunehmende) Attrakti- 
vität der ACA.’^ Bereits 1994 kam sie in 42% aller in Europa durchge führten 
Conjoint-Studien zum Einsatz.*^ 



Der Interviewablauf der ACA umfaßt 5 aufeinander aufbauende Datenerhebungs- 
schritte. Im Self-Explicated-Teil (Schritt 1 bis 3) werden die Probanden direkt 



Vgl. Bond (1991), S. 749; Müller/Kesselmann (1996), S. 193. 
Vgl. Carmone/Schaffer (1995), S. 1 17. 

Vgl. Johnson (1987), S. 259. 

Vgl. Carmone (1987), S. 327 und Green/Srinivasan (1990), S. 1 1 . 
Vgl. Wittink/Vriens/Burhenne (1994), S. 45. 

Zum Ablauf der ACA vgl. Johnson (1987), S. 259 ff. 
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nach Bewertungen für alle Eigenschaftsausprägungen und nach den Wichtigkei- 
ten der einzelnen Eigenschaften gefragt. Der sich anschließende dekompositio- 
neile Interviewteil (Schritt 4) besteht aus einer wiederholten Paarvergleichsauf- 
gabe. Den Probanden werden jeweils zwei Produktalternativen präsentiert, die 
anhand von zwei bis fünf Eigenschaften beschrieben sind. Für jeden Paarver- 
gleich soll auf einer Rating-Skala angegeben werden, welches der beiden Pro- 
dukte bevorzugt wird. Die Besonderheit der ACA besteht darin, daß die Konzep- 
tion der Paarvergleiche individuell an vorangegangene Antworten angepaßt und 
damit für jede Testperson individuell gestaltet wird. Das Interview endet jeweils 
mit der Bewertung ganzheitlich beschriebener Produktkonzepte, für die eine 
Kaufwahrscheinlichkeit von 0% bis 100% anzugeben ist (Schritt 5). Zur Bestim- 
mung der Präferenzstrukturen führt die ACA jeweils zwei getrennte Schätzungen 
durch: Sie resultieren zum einen aus dem Self-Explicated-Teil und zum anderen 
aus den Ergebnissen der Paarvergleichsaufgabe. Der fünfte Schritt dient der op- 
timalen Gewichtung dieser beiden Schätzergebnisse. 

Trotz ihrer weiten Verbreitung weist die ACA verschiedene Schwachstellen in 
der Vorgehensweise auf. Green/Krieger/Agarwal (1991) kritisieren hauptsächlich 
die wiederholte Verwendung von Paarvergleichen. Sie bewerten diese als sehr 
unrealistisch und bemängeln, daß die Paarvergleiche aufgrund ihrer Konstruktion 
zum Teil sehr schwer zu bewältigen sind.‘^ Um die Effizienz der Datenerhebung 
zu erhöhen, wird die Paarvergleichsaufgabe immer so konstruiert, daß die beiden 
Produkte in ihrer Attraktivität so ähnlich wie möglich sind.’^ Die Schwierigkeit 
für die Auskunftspersonen besteht allerdings darin, daß sie sich wiederholt zwi- 
schen Alternativen entscheiden müssen, zwischen denen sie eigentlich nahezu 
indifferent sind.^® Louviere/Gaeth (1988) betonen zudem in einer allgemeinen 
Diskussion um den Einsatz von Paarvergleichen, daß die Zahl erforderlicher Ver- 
gleiche in Abhängigkeit der Anzahl zu beurteilender Alternativen sehr schnell 
ansteigt. Im Zusammenhang mit der Paarvergleichsaufgabe weisen Sriniva- 
san/Park ( 1 997) gleichzeitig darauf hin, daß diese nicht ausreichend viele Daten- 



Vgl. Green/Krieger/Agarwal (1991), S. 220. 
Vgl. Johnson (1987), S. 262. 

Vgl. Green/Krieger/Agarwal ( 1 99 1 ), S. 2 1 6. 
Vgl. Louviere/Gaeth (1988), S. 63. 
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punkte für eine verzerrungsfreie Schätzung liefert.^^ Als letzter Kritikpunkt sei 
angemerkt, daß die Anwenderfreundlichkeit der ACA durch Integration von Da.- 
tenerhebung und deren Auswertung gleichzeitig die Gestaltungsmöglichkeiten 
enorm einschränkt. So besteht weder eine Einflußmöglichkeit auf die Konstrukti- 
on der Paarvergleiche, die den Probanden präsentiert werden, noch auf den 
Schätzprozeß, auf dem die Auswertung der Präferenzdaten beruht.^^ Über diese 
theoretischen Kritikpunkte an der ACA hinaus rechtfertigen auch bisherige empi- 
rische Ergebnisse die Dominanz des Verfahrens kaum. Agarwal (1989) berichtet, 
daß durch die zusätzlichen Informationen aus der Paarvergleichsaufgabe keine 
signifikante Verbesserung hinsichtlich der Prognoseergebnisse erzielt werden 
konnte.^"^ Auch bei zahlreichen empirischen Validitätsvergleichen ist die ACA 
einer oder mehreren der untersuchten alternativen Methoden zur Präferenzmes- 
sung unterlegen.^^ 

Faßt man die einfuhrende Diskussion zusammen, können drei wesentliche Punkte 
festgehalten werden: 

• Kenntnisse über die Nachfragerpräferenzen sind von zentraler Bedeutung für 
die Produkt-Manager, um Produkte erfolgreich am Markt einzuführen, zu 
positionieren und letztendlich zu etablieren. 

• Der Einsatz der traditionellen Conjoint- Analyse als Instrument der Marktfor- 
schung zur Messung von Nachfragerpräferenzen ist insbesondere bei An- 
wendungen mit vielen Produkteigenschaften problematisch. Zur Lösung die- 
ser Probleme sind neue, vor allem hybride Verfahren entwickelt worden. 

• Besonderer Beliebtheit erfreut sich die Adaptive Conjoint Analysis (ACA) 
als bisher einzige computergestützte hybride Methode zur Präferenzmessung. 
Trotz methodischer Schwächen und bisher kaum überzeugenden empirischen 
Ergebnissen hat sie sich nahezu als Standardinstrument zur Präferenzmes- 
sung etabliert. 



Vgl. Srinivasan/Park (1997), S. 286. 

Vgl. Carmone (1987), S. 327. 

Vgl.Agarwal(1989), S. 8. 

Vgl. hierzu die Ergebnisse der Studien von Finkbeiner und Platz (1986), Agarwal (1988) 
(beide zitiert nach Green/Srinivasan (1990), S. 11), Green, Krieger und Agarwal (1993), S. 
220 und Pullmann, Dodson und Moore (1999), S. 136. 
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Die Akzeptanz der Conjoint- Analyse und die zunehmende Vielfalt an Einsatzge- 
bieten der Präferenzmessung stellen gleichzeitig immer höhere Anforderungen an 
die Methoden.^^ Für die praktische Anwendung müssen sie vor allem für Frage- 
stellungen mit vielen Produkteigenschaften geeignet sein, wodurch computerge- 
stützten Verfahren eine immer größere Bedeutung zukommt. Die weite Verbrei- 
tung der Adaptive Conjoint Analysis (ACA) verdeutlicht diese Entwicklung. 
Aufgrund der aufgezeigten Schwächen der ACA stellt sich jedoch die Frage, ob 
alternative Verfahren besser geeignet sind, die Präferenzstrukturen der Nachfra- 
ger zu messen. 

1.2 Ziele der Arbeit 

Im Rahmen dieser Arbeit sollen neue Methoden zur Präferenzmessung entwickelt 
werden. Mit dem klaren Ziel der praktischen Anwendung müssen diese auch bei 
Studien mit vielen Produkteigenschaften einsetzbar sein. Aus diesem Grund wer- 
den computergestützte hybride Methoden entwickelt, die ebenfalls einen indivi- 
dualisierten Interviewablauf ermöglichen. Mit dieser Individualisierung wird eine 
Verringerung der Aufgabenkomplexität sowie des Erhebungsaufwands erreicht, 
da im dekompositioneilen Befragungsteil sowohl weniger als auch für jeden Pro- 
banden die tatsächlich kaufrelevanten Eigenschaften und Eigenschaftsausprägun- 
gen berücksichtigt werden. Um die Schwachstellen der ACA zu überwinden, 
werden insbesondere im Conjoint-Teil statt einer wiederholten Paarvergleichs- 
aufgabe alternative Vorgehensweisen in der Datenerhebung gewählt. Im Rahmen 
einer empirischen Anwendung der neuen Methoden und der ACA soll getestet 
werden, ob die neuen Verfahren die Schwachstellen der ACA überwinden kön- 
nen. Somit verfolgt die vorliegende Arbeit zwei wesentliche Ziele: 

• Entwicklung neuer computergestützter hybrider Conjoint-Analysen 
Entwickelt werden zwei neue computergestützte Conjoint-Analysen. Aufbauend 
auf einem von Srinivasan und Park (1997) vorgeschlagenen Ansatz, der Custo- 
mized Conjoint Analysis (im folgenden CCA), wird die Customized Compute- 
rized Conjoint Analysis (im folgenden: CCC) entwickelt. Entsprechend dem 
Ansatz von Srinivasan und Park (1997) besteht der dekompositionelle Befra- 
gungsteil aus einer Rating- oder Ranking-Aufgabe aller zu bewertenden Produk- 

Zu möglichen Einsatzgebieten der Conjoint-Analyse vgl. Gustafsson/Herrmann/Huber 

(2000), S. 6 f 



7 




te.^^ Im Vergleich dazu werden bei der ACA jeweils nur zwei Produktbeschrei- 
bungen simultan bewertet. Die Produkte werden dabei anhand der individuell 
wichtigsten Eigenschaften beschrieben, die im Rahmen der vorangegangenen 
kompositioneilen Befragung identifiziert werden. Mit der Implementierung eines 
computergestützten Interviews wird ein wesentlicher Nachteil der CCA, bedingt 
durch eine Zeitverzögerung von zwei Wochen zwischen kompositionellem und 
dekompositionellem Befragungsteil, überwunden.^^ 

Mit der Choice-Oriented Individualized Conjoint Analysis (im folgenden: 
CHIC) wird eine zweite computergestützte hybride Conjoint- Variante vorge- 
schlagen. Die Gestaltung des dekompositionellen Befragungsteils ist dabei an die 
Choice-Based Conjoint Analysis (in folgenden CBC) angelehnt, die sich zu- 
nehmender Beliebtheit im Marketing erfreut.^^ Die Besonderheit der CBC besteht 
darin, daß die Präferenzen der Probanden in Form einer Auswahlentscheidung 
erfragt werden.^^ Präsentiert werden hierfür verschiedene Teilmengen an Pro- 
duktkonzepten, aus denen sich die Probanden für jeweils eine Alternative ent- 
scheiden können.^’ In Anlehnung daran werden im Conjoint-Teil der CHIC den 
Probanden sogenannte Choice-Sets zur Bewertung präsentiert. Diese Choice-Sets 
bestehen immer aus einer Teilmenge von Produkten, die wie bei der CCC anhand 
der individuell wichtigsten Eigenschaften beschrieben werden. Damit sind bei der 
CHIC im Gegensatz zur CCC weniger Produkte simultan zu bewerten, gleich- 
wohl aber mehr als bei der ACA. 

• Empirische Validitätsprüfung der entwickelten Verfahren 
Über die Entwicklung neuer Methoden hinaus muß deren Anwendbarkeit in der 
Praxis gewährleistet sein. Ein zweites Ziel der vorliegenden Arbeit stellt daher 
eine empirische Überprüfung der neu entwickelten Methoden dar, wobei gleich- 
zeitig ein Vergleich mit bereits etablierten Verfahren vorgenommen wird. So 
wird in die empirische Studie das Standardverfahren ACA integriert, das als eine 
Referenzgröße für die Ergebnisgüte dienen soll. Darüber hinaus werden die com- 



Zur Grundidee der CCA vgl. Srinivasan/Park (1997), S. 286. 

Vgl. Srinivasan/Park (1997), S. 287. 

Vgl. hierzu Green/Srinivasan (1990); Schubert (1995) und Weiber/Rosendahl (1997). 
Vgl. Weiber/Rosendahl (1997), S. 109. 

Vgl. Schubert (1995), S. 381. 
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putergestützten hybriden Methoden mit einfacheren kompositionellen Self- 
Explicated-Modellen verglichen. Zwar wird der Conjoint- Analyse insbesondere 
durch ihren stärkeren Realitätsbezug gegenüber der Self-Explicated-Methode aus 
theoretischer Sicht stets eine höhere Prognosevalidität zugestanden, jedoch 
kann diese Überlegenheit bisher empirisch nicht eindeutig nachgewiesen werden. 
Sattler und HenseEBörner (2000) zeigen auf Basis eines Vergleichs bisheriger 
Befunde, daß nur in wenigen Fällen die Conjoint- Analyse im Vergleich zu Self- 
Explicated-Methoden signifikant validere Ergebnisse aufweist. Vielmehr zeigen 
sich in fast 80% der betrachteten Befunde keine signifikanten Unterschiede oder 
sogar eine Überlegenheit der Self-Explicated-Modelle.^^ Vor diesem Hintergrund 
wird die Self-Explicated-Methode neben der ACA als zweite Referenzgröße für 
die Ergebnisgüte der neu entwickelten Verfahren herangezogen. 

1.3 Aufbau der Arbeit 

Im Anschluß an diese Einleitung werden in Kapitel 2 die verschiedenen Ansätze 
zur Präferenzmessung dargestellt. Für alle drei Verfahrensbereiche kompositio- 
neil, dekompositionell und hybrid (vgl. Abbildung 1-1), werden die unterschied- 
lichen Varianten systematisiert und deren Besonderheiten abgeleitet. Zunächst 
werden dabei die beiden gegensätzlichen Vorgehensweisen: kompositioneil (die 
Self-Explicated-Methode) und dekompositionell (die Conjoint- Analyse) separat 
betrachtet, wobei neben der Darstellung der verschiedenen Varianten auch die 
Ergebnisse bisheriger empirischer Vergleichsstudien diskutiert werden. Eine Ge- 
genüberstellung der beiden Vorgehensweisen wird anschließend sowohl auf Ba- 
sis theoretischer Vor- und Nachteile der Verfahren als auch durch Auswertung 
empirischer Befunde vorgenommen. Als dritter Bereich werden die hybriden 
Methoden als Kombination aus Self-Explicated-Methode und Conjoint- Analyse 
vorgestellt. Über die Systematisierung der verschiedenen Formen wird auch hier 
das empirische Abschneiden der Verfahren, vor allem im Vergleich zu den bei- 
den anderen Ansätzen, rein kompositioneil und rein dekompositionell, zusam- 
mengefaßt. 



33 



Vgl. Oppedijk van Veen/Beazly (1977), S. 4; Green/Goldberg/Montemayer (1981), S. 33; 
Green/Srinivasan (1990), S. 13; Sattler/Hensel-Börner (2000), S. 124. 

Vgl. Sattler/Hensel-Börner (2000), S. 131. 
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Im dritten Kapitel werden die drei computergestützten hybriden Verfahren CCC, 
CHIC und ACA ausführlich dargestellt. Schwerpunkte der Darstellung sind je- 
weils die Vorgehensweise bei der Datenerhebung und das Schätzver fahren zur 
Ermittlung der Präferenzstrukturen. Alle drei Verfahren werden in einer empiri- 
schen Anwendung zum einen miteinander und zum anderen mit der Self- 
Explicated-Methode verglichen. Das Untersuchungsdesign dieser Studie ist Ge- 
genstand des vierten Kapitels. 

Für die vergleichende Validitätsprüfung der verschiedenen Verfahrens Varianten 
werden unterschiedliche Beurteilungskriterien herangezogen. Neben der diskri- 
minierenden Validität wird die interne Validität als Indikator für die jeweilige 
Modellgüte analysiert. Im Mittelpunkt des Verfahrens Vergleichs steht die Prüfung 
der Prognosegüte. Auf Basis der erhobenen Präferenzurteile werden für die in der 
Untersuchung betrachteten Marken Marktanteile prognostiziert. Zur Überprüfung 
der Prognosevalidität dient der Vergleich mit den in einer simulierten Kaufent- 
scheidung (sog. Holdout-Sample) beobachteten Marktanteilen. Durch einen Ver- 
gleich mit realen Marktanteilsdaten wird zudem die externe Validität der ver- 
schiedenen Verfahren getestet. Die Vorgehensweise bei der Validierung der Ver- 
fahren und die jeweiligen Ergebnisse der Validitätsprüfungen werden in Kapitel 5 
dargestellt. Das fünfte Kapitel ist dabei gemäß der eingesetzten Gütemaße unter- 
gliedert. In Abschnitt 5.5 werden die Ergebnisse hinsichtlich aller eingesetzten 
Gütemaße noch einmal zusammengefaßt. 

Die Arbeit endet im sechsten Abschnitt mit einem Fazit. Abbildung 1-2 gibt ei- 
nen Überblick über den Aufbau der Arbeit. 
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Abbildung 1-2; Aufbau der Arbeit 
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Quelle: Eigene Erstellung 
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2 Ansätze zur Messung von Nachfragerpräferenzen 

Im folgenden wird ein Überblick über bestehende Ansätze zur Präferenzmessung 
gegeben, bei denen die Präferenzen von Probanden in Form von Befragung erho- 
ben werden.^'^ Schwerpunkt der Ausführungen ist die Vorgehensweise bei der 
Datenerhebung. Unter dem Begriff Datenerhebung wird im Rahmen dieser Arbeit 
sowohl die Befragungsform (direkt oder indirekt) als auch die konkrete Gestal- 
tung der Präferenzabfrage verstanden. Über die Darstellung der verschiedenen 
Ansätze und einer Diskussion der jeweiligen Vor- und Nachteile hinaus, werden 
bisherige empirische Forschungsergebnisse zusammengefaßt. Berücksichtigt 
werden jeweils die Studien, bei denen vornehmlich ein Vergleich der Datenerhe- 
bung Untersuchungsgegenstand war oder im Rahmen anderer Untersuchungs- 
schwerpunkte implizit getestet wurde. Um insgesamt einen breiten Überblick 
über empirische Forschungsergebnisse zu den verschiedenen Ansätzen der Präfe- 
renzmessung geben zu können, werden alle seit 1980 veröffentlichten Studien in 
den internationalen Zeitschriften „Journal of Marketing Research“, „Journal of 
Marketing“, „International Journal of Research in Marketing“, „Marketing Ret- 
ters“ und „Marketing Science“ herangezogen. Für die deutschsprachige Literatur 
werden die Untersuchungen betrachtet, die in der „Zeitschrift für Betriebswirt- 
schaft“, „Zeitschrift für betriebswirtschaftliche Forschung“ , „Marketing Zeit- 
schrift für Forschung & Praxis“ und „Die Betriebswirtschaft (DBW)“ veröffent- 
licht sind. Zusätzlich werden häufig zitierte Studien und Arbeitspapiere ausge- 
wertet. 

Der Aufbau dieses Kapitels ist an die Dreiteilung der Ansätze entsprechend Ab- 
bildung 1-1 angelehnt. Zunächst werden die kompositionellen (Abschnitt 2.1) 
und die dekompositioneilen Ansätze (Abschnitt 2.2) als gegensätzliche Vorge- 
hensweisen separat betrachtet. Der Darstellung der einzelnen Varianten innerhalb 
dieser beiden Bereiche folgt eine Auswertung empirischer Befunde bisheriger 
Vergleichsstudien. In Abschnitt 2.3 folgt der getrennten Betrachtung eine ver- 



Eine weitere Möglichkeit zur Präferenzmessung stellt die Beobachtung und Auswertung 
tatsächlicher Marktdaten dar, welche in der vorliegenden Arbeit nicht weiter betrachtet 
werden soll. 



13 




gleichende Diskussion der beiden Bereiche, die in einen theoretischen und empi- 
rischen Vergleich unterteilt ist. 



Als Kombination der beiden Vorgehensweisen - kompositionell und dekomposi- 
tioneil - bilden die hybriden Verfahren einen dritten großen Verfahrensbereich 
der Ansätze zur Präferenzmessung. Die verschiedenen Varianten hybrider Ver- 
fahren werden ebenfalls dargestellt (2.4) und abschließend mit den beiden ande- 
ren Bereichen verglichen (Abschnitt 2.5). Die folgende Abbildung 2-1 gibt einen 
Überblick über den Aufbau dieses Kapitels. 



Abbildung 2-1: Überblick über den Aufbau von Kapitel 2 




Quelle: Eigene Erstellung 
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2.1 Kompositionelle Verfahren (Self-Explicated-Methode) 

Kompositionelle Methoden zur Präferenzmessung, allgemein auch Self- 
Explicated-Methoden genannt, sind maßgeblich dadurch gekennzeichnet, daß die 
Präferenzstruktur von Konsumenten direkt erhoben wird. Dabei werden Bewer- 
tungen einzelner Eigenschaften und deren Ausprägungen explizit von den Pro- 
banden erfragt und anschließend zu einem Gesamturteil zusammengefaßt.^^ 
Grundlage hierfür ist das multiattributive Modell, bei dem ein Produkt als Bündel 
von Eigenschaften charakterisiert wird.^^ Das lineare multiattributive Präferenz- 
modell^^ kann formal wie folgt dargestellt werden:^^ 

(2-1) Uj^ ^aijk-Xjk^ (i€l;meM) 

jEJkeKj 

wobei: 

Uim: Geschätzter Gesamtnutzen für die m-te Alternative fiir 

den i-ten Probanden, 

ajjk: Bewertung für die k-te Ausprägung der j-ten Eigenschaft 

durch den i-ten Probanden, 

Xjkm- ^“te Ausprägung der j-ten Eigenschaft bei der m-ten Al- 
ternative, 

J: Indexmenge der Eigenschaften, 

Kj! Indexmenge der Eigenschaftsausprägungen der j-ten 

Eigenschaft, 

I: Indexmenge der Probanden, 

M: Indexmenge der Alternativen. 

Dieses additive Nutzenmodell basiert auf der Annahme, daß sich der Gesamtnut- 
zen einer Alternative als Summe der Teilnutzen werte für die Eigenschaftsausprä- 
gungen, die diese Alternative beschreiben, ergibt. Die Teilnutzenwerte stellen da- 



Vgl. Jain/Mahajan/Malhotra (1979), S. 248. 

Vgl. Wilkie/Pessemier (1973), S. 428. 

Das multiattributive Modell geht ursprünglich auf die Einstellungsforschung zurück. In 
Anlehnung daran wird auch von der Einstellung für ein Produkt gesprochen (vgl. z.B. Wil- 
kie/Pessemier (1973)). In der Marketing-Literatur hat sich der Begriff der Präferenz, ge- 
messen durch den Nutzen, durchgesetzt und wird im folgenden angewendet. 

Die formale Darstellung ist angelehnt an Jain/Mahajan/Malhotra (1979), S. 248. 
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bei numerische Werte dar, anhand derer die subjektiven Bewertungen der Eigen- 
schaftsausprägungen abgebildet werden. Sie können für jeden Probanden berech- 
net werden und aufgrund eines einheitlichen Skalenniveaus für alle Eigenschafts- 
ausprägungen direkt miteinander verglichen werden. Alternativ besteht auch die 
Möglichkeit, die einzelnen Teilnutzenwerte unter Annahme eines nicht-linearen 
Modells zu kombinieren. Nicht-lineare Modelle zeichnen sich insbesondere da- 
durch aus, daß neben den Haupteffekten zusätzlich auch Wechselwirkungen zwi- 
schen den Eigenschaften berücksichtigt werden können. 

Neben diesem über alle kompositionellen Methoden konsistenten Grundgedanken 
der direkten Befragungsform, unterscheiden sich die verschiedenen Verfahrens- 
varianten insbesondere im Umfang der erhobenen Präferenzurteile. Bei der ein- 
fachsten Form kompositioneller Verfahren wird lediglich die Wichtigkeit der zu 
untersuchenden Eigenschaften erhoben, wobei die jeweiligen Ausprägungen der 
Eigenschaften ignoriert werden."^' Diese traditionelle Form"^^ kompositioneller 
Verfahren findet sich auch in anderen Forschungsfeldern. In der Entscheidungs- 
theorie wird beispielsweise das sog. Direct-Ratio- Verfahren"'^ eingesetzt, um die 
Wertfunktion eines Entscheiders zu ermitteln. Die mit dieser extrem einfachen 
Methode verbundenen Probleme, insbesondere der Bandbreiteneffekf^ haben 



Zur Definition der Teilnutzen werte vgl. Thomas (1979), S. 199. 

Eine sehr gute Gegenüberstellung linearer und nicht-linearer Präferenzmodelle findet sich 
bei Reiners (1996), S. 58 f 

Für die formale Darstellung impliziert dies, daß in Formel (1) der Index k für die Ausprä- 
gung der j-ten Eigenschaft entfällt. Vgl. hierzu auch die Darstellung bei Wilkie/Pessemier 
(1973), S. 429. 

Jain/Mahajan/Malhotra (1979), S. 248 sprechen bei dieser vereinfachten Form von dem 
traditionellen kompositionellen Modell. 

Das Direct-Ratio- Verfahren entspricht der vorgestellten traditionellen Form der Self- 
Explicated-Methode. 

** Vgl. Eisenführ/Weber ( 1 994), S. 1 28 f. 

Das Prinzip der Bandbreitensensitivität besagt, daß die Bedeutung einer Eigenschaft von 
den Bandbreiten der jeweiligen Eigenschaftsausprägungen abhängt (vgl. Fischer (1995), S. 
252). Dementsprechend muß sich eine Änderung der Bandbreite der Eigenschaftsausprä- 
gungen im entsprechenden Verhältnis auf das Gewicht dieser Eigenschaft auswirken. Ein 
Bandbreiteneffekt liegt dann vor, wenn die tatsächliche Variation des Bedeutungsgewich- 
tes stark von der theoretisch geforderten Variation abweicht. In diesem Fall ist der Ent- 
scheider nicht in der Lage, die Bedeutungsgewichte konsistent zu ermitteln (vgl. von 
Nitzsch/Weber (1991), S. 972). Da bei dieser traditionellen Variante der kompositioneilen 
Modelle die Wichtigkeit unabhängig von den Eigenschaftsausprägungen abgefragt wird, ist 
die Problematik der Bandbreitensensitivität von zentraler Bedeutung. Zur Bandbreitensen- 
sitivität der verschiedenen Verfahren zur Präferenzmessung vgl. Sattler/Gedenk/Hensel- 
Börner (2000). 
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dazu geführt, daß häufig eingesetzte kompositionelle Verfahren sowohl eine Be- 
wertung der Wichtigkeit der Eigenschaften als auch eine Beurteilung der Eigen- 
schaftsausprägungen umfassen. Typischerweise werden zunächst Beurteilungen 
für die Ausprägungen einer jeden Eigenschaft abgefragt. In einem zweiten Schritt 
geben die Probanden in Abhängigkeit der von ihnen bereits beurteilten Ausprä- 
gungen die Wichtigkeit für die einzelnen Eigenschaften an. Eine solche Vorge- 
hensweise wird im allgemeinen als gewichtete Self-Explicated-Methode be- 
zeichnet, wobei die konkrete Ausgestaltung dieser beiden Teilschritte variieren 
kann."^^ Während im Self-Explicated-Teil der Adaptive Conjoint Analysis (ACA) 
die Bedeutung jeder Eigenschaft separat erhoben wird'^^ schlägt Srinivasan 
(1988) vor, bei der Wichtigkeit der Eigenschaften zunächst eine sog. “kritische” 
Eigenschaft zu identifizieren. Diese “kritische” Eigenschaft soll die für den Pro- 
banden wichtigste Eigenschaft sein und bei der Beurteilung aller weiteren als 
“Anker” dienen. Ziel dieser Modifikation ist, die Wahrscheinlichkeit zu erhöhen, 
die Bedeutung der verschiedenen Eigenschaften zueinander tatsächlich auf einer 
Ratio-Skala zu ermitteln."^^ Die metrische Interpretation der daraus ermittelten 
Teilnutzenwerte setzt ein solches Skalenniveau voraus. 

Wie bereits erläutert, stellt die Abfrage der Wichtigkeiten der Eigenschaften, un- 
abhängig von einer Einschätzung der Ausprägungen, eine vereinfachte Form der 
Self-Explicated-Methode dar und entspricht der traditionellen Vorgehensweise. 
Umgekehrt wird bei einer alternativen Vereinfachung explizit auf diesen Schritt 
der Befragung verzichtet. Von den Probanden werden lediglich die verschiedenen 
Eigenschaftsausprägungen beurteilt. Unter Annahme gleicher Gewichte für alle 
Eigenschaften werden anschließend die Teilnutzenwerte ermittelt.'^^ 

Neben diesen Vereinfachungen kann die Self-Explicated-Methode auch um eine 
vorherige Abfrage völlig inakzeptabler Eigenschaftsausprägungen erweitert wer- 
den. Diese Form von Self-Explicated-Verfahren wird in der Literatur unter dem 
Begriff Conjunctive-Compensatory Self-Explicated-Methode eingeführt.^® 



Vgl. Green/Srinivasan (1990), S. 9. 

Zum Ablauf der Adaptive Conjoint Analysis vgl. Kapitel 3.3 dieser Arbeit. 

Vgl. Srinivasan (1988), S. 296. 

Vgl. Green/Krieger/Agarwal (1993), S. 373. 

Zur Conjunctive-Compensatory Self-Explicated-Methode vgl. Srinivasan (1988). 



17 




Eine solche Zweistufigkeit basiert auf der Überlegung, daß nicht akzeptable Ei- 
genschaftsausprägungen für Konsumenten k.o. -Kriterien darstellen können und 
demzufolge gar kein tatsächlicher Trade-Off mehr zwischen den verschiedenen 
Alternativen vorgenommen wird. Sofern solche absolut inakzeptablen Ausprä- 
gungen eliminiert werden, kann mit der zweiten “compensatory” Phase eher das 
tatsächliche Wahl- bzw. Entscheidungsverhalten von Nachfragern abgebildet 
werden.^' 

Abbildung 2-2 gibt einen zusammenfassenden Überblick über die verschiedenen 
Varianten kompositioneller Ansätze, differenziert nach den enthaltenen Ablauf- 
schritten bei der Datenerhebung. 



Abbildung 2-2: Ablaufschritte kompositioneller Verfahren zur Präferenzmessung 




Quelle: Eigene Erstellung 



Die Ergebnisse bisheriger empirischer Validitätsvergleiche der verschiedenen 
Varianten der Self-Explicated-Methode sind widersprüchlich. Während Agar- 
wal/Green (1991) noch eine signifikante Überlegenheit hinsichtlich der Progno- 
sevalidität des gewichteten (Schritt 2 und 3 in Abbildung 2-2) gegenüber dem 
ungewichteten Modell (nur Schritt 2 gemäß Abbildung 2-2) nachweisen kön- 



Vgl. Dorsch/Teas (1992), S. 38 f 
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nen,^^ variieren die Ergebnisse je nach Operationalisierung der Beurteilungskrite- 
rien bei Green/Krieger/Agarwal (1993) und lassen damit keine abschließende 
Aussage zugunsten einer der beiden Methoden zu.^^ 

Entsprechendes gilt für die Erweiterung der Befragung um den ersten Befra- 
gungsschritt, sprich der Eliminierung völlig inakzeptabler Eigenschaftsausprä- 
gungen (vgl. Abbildung 2-2). So testet Srinivasan (1988) die von ihm vorge- 
schlagene Conjunctive-Compensatory Self-Explicated-Methode (im folgenden: 
CC-SE) explizit gegenüber der üblichen Self-Explicated-Variante (ohne Elimi- 
nierung inakzeptabler Ausprägungen) und kann für die CC-SE eine (schwach) 
signifikant (p<0,l) höhere Prognosevalidität (gemessen durch externe Validität) 
nachweisen.^'^ Allerdings spricht gegen die Eliminierung inakzeptabler Eigen- 
schaftsausprägungen jedoch die Gefahr, daß Probanden häufig Ausprägungen zu 
schnell als solche einstufen. Obwohl Produktalternativen z.T. durch inakzeptabel 
eingestufte Ausprägungen definiert sind, werden sie bei einer anschließenden 
ganzheitlichen Beurteilung gar nicht absolut abgelehnt. Empirische Belege für 
solch ein inkonsistentes Verhalten liefern u.a. Krieger (1986)^^ 
Green/Krieger/Bansal (1988) und Dorsch/Teas (1992). Mehta/Moore/Pavia 
(1992) zeigen darüber hinaus, daß die Operationalisierung inakzeptabler Ausprä- 
gungen in der Modellschätzung einen Einfluß auf die Validität der entsprechen- 
den Modelle haben kann.^^ Eine abschließende Beurteilung der verschiedenen 
Varianten ist auf Basis bisheriger empirischer Befunde folglich nicht möglich. 

2.2 Dekompositionelle Verfahren (Conjoint-Analyse) 

Grundidee der Conjoint-Analyse ist es, die Probanden zunächst ganzheitlich be- 
schriebene Produktalternativen beurteilen zu lassen. Aufgabe des Marktforschers 
ist dann, den Nutzenbeitrag, gemessen durch den Teilnutzenwert, jeder einzelnen 
Eigenschaftsausprägung zum Gesamturteil zu ermitteln. Somit ist die Vorge- 
hensweise der Conjoint-Analyse im wesentlichen dadurch gekennzeichnet, daß 
statt Bewertungen für die einzelnen Eigenschaften zu einem Gesamturteil zu- 



Vgl. Agarwal/Green (1991), S. 145. 

Vgl. Green/Krieger/Agarwal (1993), S. 378. 
Vgl. Srinivasan ( 1 988), S. 304. 

Zitiert nach Dorsch/Teas (1992), S. 39. 

Vgl. Mehta/Moore/Pavia ( 1 992), S. 473 f. 
Vgl. Green/Srinivasan (1978), S. 104. 
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sammengefiigt, Gesamturteile in die einzelnen Nutzenbeiträge der Eigenschaften 
zerlegt werden.^^ Grundlage hierfür ist wiederum das additive Nutzenmodell 

(2-2) U|„ = X Zßijk • ^jkm + (iel; itigM) 

jeJ ksKj 

wobei: 

Uim! Geschätzter Gesamtnutzen für die m-te Alternative für 
den i-ten Probanden, 

ßjj,^: Teilnutzenwert für die k-te Ausprägung der j-ten Eigen- 

schaft für den i-ten Probanden, 

1 : wenn bei der m-ten Alternative die k-te Ausprägung 
Xjkm= \ der j-ten Eigenschaft au ftritt, 

. 0: sonst, 

Störterm. 

Der entscheidende Unterschied zu den Self-Explicated-Verfahren liegt in der Be- 
stimmung der Parameter dieses Modells.^® Auf Basis erhobener Gesamturteile für 
ganzheitlich beschriebene Produktalternativen werden die Teilnutzenwerte 
jetzt für die verschiedenen Eigenschaftsausprägungen geschätzt. Aus diesem 
Grund muß das Modell um einen Störterm Cjm erweitert werden.^' Während diese 
dekompositioneile Vorgehensweise Grundgedanke aller Conjoint-Verfahren ist, 
liefert die Literatur zahlreiche Varianten zur Ausgestaltung einer Conjoint- 
Analyse, die im folgenden dargestellt werden. 

2.2.1 Systematisierung dekompositioneller Ansätze zur Präfe- 
renzmessung 

Die Conjoint-Analyse stellt den bedeutendsten Vertreter dekompositioneller 
Verfahren zur Präferenzmessung dar und steht im Mittelpunkt der folgenden Be- 



Vgl. Stallmeier (1993), S. 11. 

Es sei daraufhingewiesen, daß auch an dieser Stelle die Annahme eines additiven Modells 
nicht zwingend ist. Prinzipiell sind ebenso nicht-lineare Modelle einsetzbar. Das additive 
Modell wird jedoch vor allem aufgrund seiner Robustheit und einfachen Handhabung bei 
der Schätzung am häufigsten angewendet (vgl. u.a. Backhaus et al. (1996), S. 509 und Rei- 
ners(1996), S. 59). 

“ Vgl. Jain/Mahajan/Malhotra (1979), S. 249. 

Zur formalen Darstellung des additiven Modells im Rahmen der Conjoint-Analyse vgl. 
auch Vriens (1995), S. 9. 
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trachtung.^^ Die verschiedenen Varianten der Conjoint- Analyse werden kurz vor- 
gestellt, wobei der Schwerpunkt der Ausführungen auf der Vorgehensweise bei 
der Datenerhebung liegt. Die Varianten werden dabei zunächst nach der Anzahl 
simultan zu beurteilender Alternativen systematisiert. Unterschieden werden 
dabei folgende 3 Fälle: 

1 . alle zu beurteilenden Stimuli^^ sind simultan zu bewerten, 

2. verschiedene Teilmengen sind separat zu bewerten oder 

3. lediglich 2 Stimuli werden simultan präsentiert. 

Teilweise bereits durch die Anzahl der zu beurteilenden Stimuli determiniert, 
können die verschiedenen Conjoint- Varianten darüber hinaus nach der Art der 
Beurteilungsaufgabe für den Probanden differenziert werden.^'^ Diese beiden 
Abgrenzungskriterien definieren gleichzeitig das Skalenniveau der abhängigen 
Variable, die in das unterstellte Nutzenmodell eingeht.^^ Abbildung 2-3 gibt einen 
Überblick über verschiedene Conjoint- Varianten systematisiert nach den beiden 
angeführten Abgrenzungskriterien. 



Der zweite große Bereich dekompositioneller Verfahren wird unter dem Begriff Multidi- 
mensionale Skalierung (MDS) subsumiert (vgl. Herrmann/Schmidt-Gallas/Huber (2000), 
S. 255). Die Besonderheit der MDS im Vergleich zur Conjoint-Analyse besteht darin, daß 
die Eigenschaften der zu beurteilenden Produktkonzepte nicht a priori festgelegt werden 
müssen, sondern nachträglich auf Basis subjektiver Ähnlichkeitsurteile abgeleitet werden 
(vgl. Backhaus et al. (1996), S. 433. 

Die im Rahmen einer Conjoint-Analyse zu beurteilenden Produktbeschreibungen werden 
üblicherweise als Stimuli bezeichnet. 

Eine alternative Systematisierung der Bewertungsformen in “qualitative” und quantitative” 
Ansätze schlägt Stallmeier (1993) S. 57 ff. vor. 

Vgl. hierzu die Ablaufschritte einer Conjoint-Analyse nach Green/Srinivasan (1978) S. 105 
bzw. (1990)S. 5. 
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Abbildung 2-3; Systematisierung dekompositioneller Ansätze 




2.2.1. 1 Ansätze mit simultaner Bewertung aller Stimuli 

In der traditionellen Form der Conjoint- Analyse werden den Probanden alle zu 
beurteilenden Stimuli gleichzeitig vorgelegt. Die Stimuli stehen dabei für Pro- 
duktalternativen, die bei der sog. Voll-Profil-Methode durch sämtliche zu unter- 
suchenden Produkteigenschaften beschrieben sind.^^ Ohne späteren Ausführun- 
gen vorgreifen zu wollen, sei an dieser Stelle bereits angemerkt, daß dieser klas- 
sischen Form der Conjoint- Analyse in mehrfacher Hinsicht Grenzen gesetzt sind. 
Zum einen ist die Anzahl an Eigenschaften, durch die ein Stimulus beschrieben 
werden kann, speziell bei der Voll-Profil-Methode begrenzt. Green/Srinivasan 
(1990) empfehlen, nicht mehr als 6 Eigenschaften zu verwenden.^^ Zum anderen 
kann den Probanden nur eine begrenzte Anzahl an Stimuli insgesamt zur Beur- 



Bei der Präsentationsform der Produktbeschreibungen kann zwischen verbaler, bildlicher 
und multimedialer Darstellung variiert werden. Des weiteren können den Probanden reale 
Produkte zur Beurteilung vorgelegt werden. Einen Überblick zu empirischen Untersuchun- 
gen, die den Einfluß der Präsentationsform auf die Validität von Conjoint-Analysen über- 
prüfen, geben Ernst/Sattler (2000). Die Variationsmöglichkeiten bei der Präsentationsform 
werden im Rahmen dieser Arbeit nicht weiter berücksichtigt, da sie für die hier behandelte 
Fragestellung keine entscheidende Rolle spielen. 

Vgl. Green/Srinivasan (1990), S. 8. 
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teilung vorgelegt werden. Hierbei gilt es, in Abhängigkeit der zu schätzenden 
Parameter ausreichend viele Datenpunkte in Form bewerteter Stimuli zu erheben 
und gleichzeitig eine Obergrenze von ca. 30 Stimuli nicht zu überschreiten, um 
die Probanden kognitiv nicht zu überfordern.^^ Diese Obergrenze wird allerdings 
bereits bei einer sehr geringen Anzahl an Eigenschaften und Ausprägungen er- 
reicht. So besteht ein vollständiges Design bei 3 Eigenschaften mit je 3 Ausprä- 
gungen aus 3*3*3=27 Stimuli.^^ Da bei den meisten Anwendungen der Conjoint- 
Analyse wesentlich mehr Eigenschaften von Interesse für den Anwender sind, 
werden meist fraktionierte Designs gebildet, die das vollständige Design mög- 
lichst gut abbilden.^^ Einen Lösungsvorschlag, um bereits die Anzahl zu betrach- 
tender Eigenschaften und die daraus resultierenden Stimuli zu reduzieren, liefert 
Schweikl (1985). Im Rahmen eines computergestützten Interviews werden für 
jeden Probanden die individuell wichtigsten Eigenschaften identifiziert und nur 
diese im folgenden Conjoint-Interview berücksichtigt.^’ Damit wird die Anzahl 
zu untersuchender Eigenschaften reduziert und gleichzeitig sichergestellt, daß 
keine für die Testperson auswahlentscheidenden Attribute vernachlässigt wer- 
den. Köcher (1997) schlägt mit der MaiK-Conjoint- Analyse zusätzlich eine In- 
dividualisierung der Produktkonzepte vor, zu denen die Eigenschaftsausprägun- 
gen kombiniert werden. 



Neben der Anzahl simultan zu beurteilender Stimuli können die Varianten der 
Conjoint- Analyse nach Art der Beurteilungsaufgabe abgegrenzt werden.^'^ Die für 
die Probanden wohl einfachste Form ihre Präferenzen auszudrücken, stellt das 
sogenannte Category Assignment dar. Die Aufgabe für die Probanden besteht 



Green/Srinivasan (1978), S. 109 nennen als Obergrenze 30 Stimuli, um die Probanden 
kognitiv nicht zu überlasten. Louviere/Gaeth (1988), S. 60 nennen mit 32 Stimuli eine ent- 
sprechende Größenordnung. 

69 

Ein vollständiges Design umfaßt alle konstruierbaren Eigenschaftskombinationen bei ge- 
gebener Anzahl an Eigenschaften und deren Ausprägungen. 

Da die Gestaltung und Fraktionierung der Designs jedoch nicht Kern der vorliegenden 
Arbeit sind, wird zu dieser Problematik auf die Literatur verwiesen. So führt Stallmeier 
(1993) beispielsweise explizit eine Simulationsanalyse zum Einfluß der Untersuchungsde- 
signs auf die Ergebnisstabilität der Conjoint-Analyse durch. 

Vgl. Schweikl (1985), hier: S. 111. 

Vgl. Boecker/Schweikl ( 1 988), S. 1 5. 

” Vgl. Köcher (1997), S. 141. 

Da sowohl Stallmeier (1993), S. 57-63 als auch Reiners (1996), S. 88-98 einen sehr umfas- 
senden Überblick über Formen der Beurteilungsaufgabe geben, wird an dieser Stelle auf 
eine ausführliche Diskussion verzichtet und die angegebene Literatur empfohlen. 
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dabei lediglich in der Zuordnung der Produktkonzepte zu verschiedenen Katego- 
rien. Louviere/Fox/Moore (1993) integrieren in einem Vergleich unterschiedli- 
cher Beurteilungsaufgaben u.a. die Aufgabe, die vorgelegten Stimuli in die Kate- 
gorien “würde ich in Betracht ziehen” und “würde ich nicht in Betracht ziehen” 
einzuordnen.^^ Nicht zuletzt der extrem hohe Informationsverlust durch diese 
Vorgehensweise ist ein Grund, daß das Category Assignment in der praktischen 
Anwendung kaum von Bedeutung ist. Vielmehr wird es in Kombination mit an- 
deren Bewertungsformen der Stimuli eingesetzt. So kann einer differenzierten 
Beurteilung der Stimuli eine Einteilung in verschiedene Kategorien zur Vereinfa- 
chung vorangestellt werden. In der klassischen Form der Conjoint- Analyse 
werden Präferenzurteile durch Rangreihung (Ranking) der präsentierten Stimuli 
erhoben. Der Proband wird gebeten, die ihm vorgelegten Stimuli in die Rangfol- 
ge zu sortieren, in der er sie am ehesten wählen bzw. kaufen würde. Sollen die 
Präferenzunterschiede zwischen den Produktalternativen quantifiziert werden, 
müssen die Stimuli anhand einer Rating-Skala bewertet werden. Dabei kann die 
Präferenz einer Produktalternative beispielsweise mit einer 1 1 -Punkte-Rating- 
Skala (1 = “am wenigsten präferiert”; 11 = “am meisten präferiert”) konkref^ 
oder jeweils in Relation zu einem “Standardprodukt” erfragt werden.^^ Alternativ 
können die Skalenpunkte einer Rating-Skala auch als Kaufwahrscheinlichkeiten 
definiert werden. Huber et al. (1993) setzen eine 9-Punkte-Rating-Skala ein, de- 
ren Endpunkte als “10% oder niedrigere” bzw. “90% oder höhere” Kaufwahr- 
scheinlichkeit definiert sind. Kalish/Neslin (1991) schlagen weiterhin vor, nach 
dem Reservationspreis für einen Stimuli zu fragen.^® Somit wird die Präferenz 
für ein Produkt explizit in Form einer monetären Größe ausgedrückt. Als weitere 
Bewertungsmöglichkeit sei das Konstant-Summen-Verfahren angeführt.^’ Die 



Vgl. Louviere/Fox/Moore (1993), S. 206. 

Vgl. Reiners(1996), S.90. 

Vgl. z.B. Leigh/MacKay/Summers (1984), S. 458. Die Anzahl der Skalenpunkte ist dabei 
selbstverständlich nicht fest vorgegeben. 

Vgl. die Definition der Skalenpunkte bei Louviere/Gaeth (1988), S. 68. 

Vgl. Huber et al.( 1993), S. 108. 

Der Reservationspreis für ein Produkt entspricht dem Preis, den ein Konsument für dieses 
Produkt maximal zu zahlen bereit ist. Dieser Preis entspricht gleichzeitig dem Nutzen für 
dieses Produkt bei dem entsprechenden Konsumenten (vgl. Kalish/Nelson (1991) S. 328). 

8 1 

Zur Vorgehensweise beim Konstant-Summen-Verfahren vgl. z.B. Mahajan/Green/Gold- 
berg(1982), S. 337. 
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beiden letztgenannten Methoden können im weiteren Sinne als unterschiedliche 
Gestaltungsform einer Rating-Skala interpretiert werden. 

Welcher Bewertungsform bei der Ermittlung von Nachfragerpräferenzen der 
Vorzug gegeben werden sollte, ist a priori nicht zu beantworten. Für den Einsatz 
der Rating-Methode sprechen zweifelsohne die detaillierten Informationen, die 
durch das implizit höhere Skalenniveau erhoben werden. Jedoch birgt dieses 
Vorgehen die Gefahr, daß insbesondere bei einer großen Anzahl an Stimuli diese 
den Probanden zwar simultan vorgelegt, tatsächlich aber separat beurteilt werden. 
Demgegenüber werden die Testpersonen bei einer Ranking- Aufgabe zu tatsächli- 
chem Abwägen zwischen den verschiedenen Eigenschaften gezwungen, was der 
eigentlichen Idee der Conjoint- Analyse wesentlich näher kommt.^^ Als Kritik- 
punkt sowohl an der Bewertung der Stimuli durch Rangreihung als auch durch 
eine (beliebige) Rating-Skala wird immer wieder angeführt, daß lediglich Präfe- 
renzen, nicht aber tatsächliches Auswahlverhalten von Konsumenten erhoben 
werden.^^ Malhotra (1986) schlägt deshalb vor, die Produktalternativen zunächst 
danach zu differenzieren, ob grundsätzlich eine Kaufbereitschaft besteht. Sofern 
Produkte völlig inakzeptabel für eine Testperson sind, werden für diese keine 
Aussagen zu deren Präferenz mehr erfragt. Präferenzen werden in einem zweiten 
Schritt lediglich für die Alternativen erhoben, die für den Befragten in Frage 
kommen.^"^ Auf dem gleichen Grundgedanken basiert die von Voeth/Hahn (1998) 
vorgestellte Limit Conjoint-Analyse. Sie stellt ebenso eine Erweiterung der tradi- 
tionellen Conjoint- Analyse dar, bei der zusätzlich zu den erhobenen Präferenzur- 
teilen eine Auswahlentscheidung integriert wird. Damit sollen zusätzlich zu den 
Präferenzen gegenüber den Stimuli diejenigen identifiziert werden, für die die 
Probanden auch eine Kaufbereitschaft aufweisen.^^ Im Gegensatz zu Malhotra 
(1986) wird die Kaufbereitschaft im Anschluß an die erhobenen Präferenzen ab- 
gefragt. 



Vgl. Stallmeier (1993), S. 57. 

Vgl. hierzu Louviere/Gaeth (1988), S. 59; Oliphant et. al. (1992), S. 385 und El- 
rod/Louviere/Davey (1992), S. 368. 

Vgl. Malhotra (1986), S. 34. Die Vorgehensweise von Malhotra stellt ein Beispiel für das 
oben beschriebene Category Assignment dar. Eine Besonderheit liegt darin, daß für die 
Stimuli, die für einen Kauf überhaupt nicht in Frage kommen, keine weiteren Präfe- 
renzurteile erhoben werden. 

** Vgl. Voeth/Hahn ( 1 998), S, 1 20 f. 
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2.2.1.2 Ansätze mit simultaner Bewertung einer Teilmenge der Stimuli 

Um eine Infonnationsüberlastung der Probanden zu vermeiden und gleichzeitig 
eine größere Anzahl an Eigenschaften berücksichtigen zu können, besteht die 
Möglichkeit, die zu beurteilenden Stimuli auf einzelne Teilmengen zu verteilen. 
Bei sogenannten “Bridging”-Designs werden alle Stimuli auf verschiedene Stapel 
verteilt, die jeweils separat beurteilt werden. Sichergestellt werden muß lediglich, 
daß wenigstens eine Eigenschaft bei allen Produktbeschreibungen identisch ist, 
um die Ergebnisse der einzelnen Teilmengen für die Schätzung wieder zusam- 
menfugen zu können.^^ Die Reduzierung der gleichzeitig zu beurteilenden Sti- 
muli mittels “Bridging” ist unabhängig von der Art der Beurteilungsaufgabe und 
kann prinzipiell mit allen diskutierten Formen der Präferenzabfrage kombiniert 
werden. Obwohl Bretton-Clark' s BRIDGER eine Software zur Gestaltung eines 
Bridging-Designs anbietet, ist diese Vorgehensweise bisher verhältnismäßig sel- 
ten eingesetzt worden. 

Eine wesentlich bedeutendere Rolle spielt die Aufteilung der zu beurteilenden 
Stimuli auf verschiedene Teilmengen in Zusammenhang mit der sog. Choice- 
Based Conjoint Analysis (CBC).^^ Neben der Reduzierung simultan zu bewer- 
tender Stimuli ist die CBC maßgeblich dadurch gekennzeichnet, daß den Proban- 
den tatsächliche Auswahlentscheidungen abverlangt werden. Hierfür wird jeweils 
eine Teilmenge an Stimuli (sog. Choice-Set) präsentiert, aus denen sie lediglich 
die für sie beste Alternative auswählen. Auf diese Weise werden die Probanden 
zu einer echten Auswahlentscheidung gezwungen, statt Präferenzen zwischen 
Alternativen anzugeben. Damit sind bei der CBC im Gegensatz zu Ranking- oder 
Rating-basierten Conjoint- Analysen keine Annahmen über das Kaufverhalten zu 
treffen, da das Auswahlverhalten direkt beobachtet wird.^^ Eine weitere Beson- 
derheit der CBC liegt in der Berücksichtigung einer “Nicht-Kauf- Alternative” in 
jedem Choice-Set. Damit haben die Probanden die Möglichkeit, alle innerhalb 
eines Choice-Sets präsentierten Stimuli abzulehnen, sofern keine für sie attraktive 



Vgl. Green/Srinivasan (1990), S. 9. 

Nach Kenntnis der Autorin sind Studien von Rosko et al. (1985) und Baalbaki/Malhotra 
(1995) die einzigen Veröffentlichungen, in denen ein Bridging-Design angewendet wurde. 
Zu den Grundlagen der Choice-Based Conjoint Analysis vgl. Batsell/Louviere (1991); 
Louviere (1988) und Louviere/Woodworth (1983). 

Vgl. Weiber/Rosendahl (1997), S. 109. 
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Alternative angeboten wird.^^ Insgesamt wird der CBC ein höherer Realitätsbe- 
zug zugesprochen, da die Beurteilungsaufgabe wesentlich näher an der tatsächli- 
chen Kaufsituation liegt und damit besser geeignet ist, das Kauf- bzw. Auswahl- 
verhalten zu prognostizieren.^' 

Ein wesentlicher Nachteil der CBC betrifft allerdings das Aggregationsniveau der 
geschätzten Teilnutzen werte. Während die traditionelle Conjoint- Analyse die 
Schätzung individueller Nutzenfunktionen ermöglicht, lassen Choice- 
Experimente lediglich eine aggregierte (ggf segmentweise) Auswertung zu.^^ 
Auch wenn beispielsweise Oliphant et. al. (1992) zeigen können, daß die Ergeb- 
nisse einer CBC nachträglich disaggregiert werden können, um individuelle Un- 
terschiede in den Teilnutzen werten berücksichtigen zu können^^ zielen neuere 
Auswertungsmethoden darauf ab, die Heterogenität zwischen den Probanden be- 
reits bei der Schätzung einzubeziehen.^'^ Dieses Vorgehen stellt einen weiteren 
Versuch dar, individuelle Unterschiede in die auf der Basis von Choice- 
Experimenten ermittelten Nutzenfunktionen zu integrieren. Ein weiterer Kritik- 
punkt an der CBC betrifft die Ineffizienz, mit der Präferenzdaten erhoben wer- 
den. Während vom Probanden jeweils nur die für ihn beste Alternative eines 
Choice-Sets identifiziert wird, muß der Proband fiir diese Auswahlentscheidung 
eine Vielzahl an Informationen erfassen und verarbeiten. Jeder Stimulus wird 
durch mehrere Eigenschaften beschrieben und jedes Choice-Set besteht aus meh- 
reren Produktalternativen.^^ Durch die sehr eingeschränkte Abfrage nach der in- 
dividuell besten Alternative je Choice-Set, werden nur sehr wenige Informatio- 
nen letztendlich erhoben. Der Informationsverlust wird noch größer, wenn der 
Proband die “Nicht-Kauf- Alternative” wählt, da in diesem Fall keinerlei Aussa- 
gen zu seinen Präferenzen zwischen den einzelnen Alternativen möglich sind.^^ 



Vgl. Oliphant et. al. (1992), S. 385. 

Zu den Vorteilen von Clioice-Experimenten vgl. z.B. Louviere/Gaeth (1988), S. 62. 

Vgl. u.a. Louviere (1988), S. 99 und Elrod/Louviere/Davey (1992), S. 368. 

Vgl. Oliphant et al. (1992), S. 393. 

Neuere Ansätze zur Berücksichtigung von Heterogenität in Choice-Experimenten werden 
u.a. von DeSarbo/Ramaswamy/Cohen (1995); Johnson (1997b) und Zwerina/Huber (1996) 
vorgeschlagen. 

Q< 

Vgl. Sawtooth Software (1995), S. 1. 

Vgl. Elrod/Louviere/Davey (1992), S. 370. 
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2.2.1.3 Ansätze mit simultaner Bewertung von genau zwei Stimuli 

Die kleinste Teilmenge und damit die Untergrenze simultan zu bewertender Sti- 
muli liegt bei zwei. In der einfachen Form der daraus resultierenden Paarver- 
gleiche gibt die Testperson lediglich an, welchen der beiden Stimuli sie vorzieht. 
Darüber hinaus muß bei einem sogenannten “Graded Paired Comparison” zu- 
sätzlich angegeben werden, wie stark der entsprechende Stimulus bevorzugt wird. 
Das Ausmaß der Präferenz kann durch den Einsatz einer Rating-Skala quantifi- 
ziert werden oder die Testperson gibt im Rahmen einer “Dollar-Metrik” an, wie- 
viel mehr sie bereit wäre, für die bevorzugte Produktalternative zu bezahlen. 
Für den Einsatz von Paarvergleichen spricht die Tatsache, daß die Anzahl zu ver- 
arbeitender Informationen pro Beurteilungsaufgabe minimiert wird und Präfe- 
renzurteile zwischen den Paaren in eine Rangfolge aller Stimuli transformiert 
werden können.^^ Gleichzeitig darf dieser Vorteil allerdings nicht darüber hin- 
wegtäuschen, daß gerade diese geringe Zahl an Informationen je Paarvergleich 
eine häufige Wiederholung derselben mit unterschiedlichen Stimuli erforderlich 
macht. Veranschaulicht werden kann dies daran, daß für die Ableitung einer 
Rangfolge für n Stimuli insgesamt n*(n-I)/2 Paarvergleiche erforderlich sind. 
Dies macht die Ineffizienz der Datenerhebung auf Basis von Paarvergleichen 
deutlich.^^ 

Als alternatives Vorgehen zur Voll-Profil-Methode wird häufig in der Literatur 
die von Johnson (1974) vorgestellte Trade-Off-Methode genannt. Die Beson- 
derheit dieser Methode liegt darin, daß die zu bewertenden Stimuli nicht durch 
sämtliche Eigenschaften beschrieben werden, sondern lediglich durch zwei Ei- 
genschaften.’^’ Die Aufgabe der Probanden besteht darin, die Kombination ver- 
schiedener Ausprägungen zweier Eigenschaften, dargestellt in einer Trade-Off- 
Matrix, zu bewerten. Damit kann diese Vorgehensweise, die auch als Two- 



Vgl. z.B. Leigh/MacKay/Summers ( 1 984), S. 457 oder Stallmeier ( 1 993), S. 22 1 . 

Vgl. Reynolds/Jolly ( 1 980), S. 532. 

QO 

Vgl. hierzu auch Reiners (1996), S. 93 und Louviere/Gaeth (1988), S. 63. 

Zur Trade-Off-Methode vgl. insbesondere Johnson ( 1 974). 

”” Es sei daraufhingewiesen, daß auch bei den bereits diskutierten Varianten der Conjoint- 
Analyse nicht zwingend die Voll-Profil-Methode, d.h. die Beschreibung der Stimuli an- 
hand sämtlicher Eigenschaften, eingesetzt werden muß. Auch hier ist eine Reduzierung der 
Eigenschaften prinzipiell möglich. Die Trade-Off-Methode ist dagegen dadurch gekenn- 
zeichnet, daß die Stimuli immer durch genau zwei Eigenschaften beschrieben werden. 
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factor>at-a-time-Verfahren bezeichnet wird, nur eingeschränkt der gewählten 
Systematisierung zugeordnet werden. Statt zwei simultan zu beurteilender Stimu- 
li, sind es genau zwei Eigenschaften, durch die Alternativen beschrieben werden 
und zwischen denen ein Trade-Off gemacht werden muß. Diese Besonderheit ist 
jedoch maßgebliches Kennzeichen der Methode und ist ausschlaggebend für de- 
ren Einordnung an dieser Stelle. Analog zu Paarvergleichen mit Voll-Profilen 
liegt der Vorteil dieser Methode in dem begrenzten Maß simultan zu verarbeiten- 
der Informationen. Damit verbunden ist aber ebenfalls eine gewisse Ineffizienz 
bei der Datenerhebung. Zudem kann als Kritikpunkt angeführt werden, daß die 
Trade-Off-Analyse der dekompositioneilen Grundidee der Conjoint- Analyse nur 
bedingt gerecht wird, da statt ganzheitlicher Produkte vereinfachte Eigenschafls- 
kombinationen bewertet werden. Der damit verbundene Real itäts Verlust der Be- 
fragungsform als auch die Ineffizienz in der Datenerhebung mögen Gründe dafür 
sein, daß die Trade-Off-Methode in der praktischen Anwendung eine deutlich 
geringere Bedeutung als der Voll-Profil-Methode zukommt. 

2.2.2 Empirische Vergleiche zwischen unterschiedlichen dekom- 
positioneilen Ansätzen 

Die Ungewißheit darüber, mit welcher Form der Conjoint- Analyse die tatsächli- 
chen Präferenzen von Konsumenten am ehesten erfaßt werden können, haben zu 
einer intensiven Diskussion der verschiedenen Varianten in der Literatur geführt. 
So wundert es nicht, daß zahlreiche empirische Vergleiche durchgeführt wurden. 
Die bisherigen Forschungsergebnisse werden an dieser Stelle zusammengefaßt, 
um zu prüfen, ob sich in diesen Untersuchungen einzelne Formen der Conjoint- 
Analyse als überlegen ausgezeichnet haben. Die verschiedenen Studien unter- 
scheiden sich dabei sowohl in den jeweils betrachteten Methoden als auch hin- 
sichtlich der eingesetzten Gütemaße zur Beurteilung der Methoden. Da die Defi- 
nition und Abgrenzung der verschiedenen Beurteilungskriterien in der Literatur 



Wittink/Cattin (1989) berichten, daß bei kommerziellen Conjoint-Studien in den USA in 
der Zeit von 1971-1980 in 27% aller Studien die Trade-Off-Methode eingesetzt wurde. 
Von 1981-1985 war dies nur noch in lediglich 6% der Anwendungen der Fall (vgl. Wit- 
tink/Cattin (1989), S. 93). Überraschenderweise können Wittink/Vriens/Burhenne (1994) 
bei einem entsprechenden Überblick mit 15% zwar über einen stärkeren Einsatz der Trade- 
Off-Methode bei kommerziellen Anwendungen in Europa berichten, jedoch liegt der Anteil 
auch hier niedriger als bei der Voll-Profil-Methode mit 24% (vgl. Wittink/Vriens/Burhenne 
(1994), S. 45). Johnson, auf den die Methode zurückgeführt werden kann, spricht selbst 
davon, daß die Trade-Off-Analyse in der praktischen Anwendung bereits “obsolet” gewor- 
den ist (zitiert nach Wittink/Vriens/Burhenne (1994), S. 45). 
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teilweise voneinander abweichen, wird deren Operationalisierung in dieser Arbeit 
im folgenden Abschnitt kurz erläutert. 

2.2.2.1 Gütemaße 

Reliabilität: 

Ausgewiesen werden die Studien, die explizit die Reliabilität verschiedener Me- 
thoden vergleichen. Grundlage für dieses Gütemaß ist eine wiederholte Befra- 
gung derselben Person mit der gleichen Datenerhebungsmethode und den identi- 
schen Stimuli. Die Reliabilität mißt dann den Grad der Übereinstimmung der Er- 
gebnisse und läßt eine Aussage bzgl. der Konsistenz im Antwortverhalten der 
Probanden zu.’^^ 

Diskriminierende Validität: 

Unter diesem Validitätskriterium werden die Vergleichsstudien betrachtet, bei 
denen die geschätzten Teilnutzenwerte oder daraus ermittelte Bedeutungsge- 
wichte verschiedener Methoden gegenübergestellt werden. Die Frage dabei ist, 
ob unterschiedliche Methoden zur Erfassung von Präferenzen zu Unterschieden 
in den geschätzten Präferenzstrukturen führen.’®^ 



Zu unterschiedlichen Begriffsabgrenzungen der Gütemaße vgl. Bateson/Reibstein/Boul- 
ding(1987). 

Zum Begriff der Reliabilität vgl. Hammann/Erichson (1994), S. 75 ff. und Böhler (1992), 
S. 102 ff 

Verschiedene Autoren sprechen ebenfalls von der Überprüfung der Reliabilität, sofern die 
Aufgabe mit derselben Datenerhebungsmethode aber unterschiedlichen Untersuchungsob- 
jekten (Stimuli) wiederholt durchgefuhrt wird (vgl. u.a. Agarwal/Green (1991), S. 144). 
Entsprechend dieser weiten Begriffsabgrenzung müßten alle Tests auf Basis eines “Hold- 
out-Sample“ unter Reliabilitätsprüfungen subsumiert werden (vgl. Bateson/Reibstein/ 
Boulding (1987), S. 473). Dabei wird allerdings nicht die Korrespondenz eingesetzter In- 
putdaten überprüft, sondern es werden bereits Prognosen basierend auf den geschätzten 
Nutzenmodellen durchgeführt. Aus diesem Grund wird eine solche Vorgehensweise (ins- 
besondere mit einem Holdout-Sample) im Rahmen dieser Arbeit als Überprüfung der Pro- 
gnosegüte definiert. 

Dabei werden auch die Studien herangezogen, bei denen ursprünglich die konvergierende 
Validität getestet wird. Eine Überprüfung der konvergierenden Validität impliziert einen 
entsprechenden Vergleich zwischen den Verfahren. Der Unterschied besteht lediglich in 
der Formulierung der Ausgangshypothese. In beiden Fällen wird getestet, ob Unterschiede 
zwischen den Ergebnissen alternativer Verfahren auftreten. Während bei der konvergieren- 
den Validität keine Unterschiede erwartet werden, wird die Ausgangshypothese bei der 
diskriminierenden Validität genau umgekehrt formuliert. In diesem Fall wird vermutet, daß 
verschiedene Methoden der Präferenzmessung zu unterschiedlichen Ergebnissen führen. 
Entsprechend wird an dieser Stelle von diskriminierender Validität gesprochen. 
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Interne Validität 



Die interne Validität stellt ein Gütemaß dar, bei dem die Modellgüte an sich 
überprüft wird. Gemessen wird die Übereinstimmung zwischen den Inputdaten 
und den auf deren Grundlage geschätzten Werten für die abhängige Variable. 
Als abhängige Variable gehen die empirisch beobachteten Präferenzdaten in das 
Modell ein, die durch die geschätzten Outputdaten rechentechnisch rekonstruiert 
werden sollen.’®^ 

Prognosevalidität: 

Vornehmliches Ziel der Präferenzmessung ist, auf Basis erhobener Präferenzda- 
ten und den daraus ermittelten Präferenzstrukturen das Wahlverhalten bzw. 
Kaufverhalten der Probanden auch für alternative und neue Produkte prognosti- 
zieren zu können. Mit der Prognosevalidität wird explizit die Eignung der unter- 
schiedlichen Ansätze hierfür getestet. In zahlreichen Studien wird zu diesem 
Zweck mit Hilfe eines Holdout-Sample'®^ eine Kaufsituation simuliert. Die Pro- 
gnosegüte prüft dann, wie gut mittels der geschätzten Präferenzstrukturen das 
Verhalten der Probanden in dieser simulierten Kaufentscheidung prognostiziert 
werden kann.'‘^ 

Externe Validität: 

Die externe Validität stellt das stärkste Validitätsmaß dar. Sie liegt dann vor, 
wenn unter Verwendung der Schätzergebnisse das Entscheidungsverhalten bzw. 
Präferenzen in von der Befragung völlig unabhängigen Situationen prognostiziert 
werden kann. Beispiele hierfür sind die Prognose realer Marktanteile oder des 
tatsächlichen Entscheidungsverhaltens zum Untersuchungsgegenstand, ggf mit 
einer zeitlichen Verzögerung.’" Ein Vergleich zwischen den auf Basis einer Be- 
fragung geschätzten und den tatsächlich beobachteten Präferenzen stellt ein Maß 
für die externe Validität der Schätzergebnisse dar. 



Vgl. Green/Srinivasan (1978), S. 1 15. 

Vgl. hierzu auch Baier/Säuberlich (1997), S. 968. 

Von einem Holdout-Sample wird gesprochen, wenn unabhängig von der eigentlichen Be- 
fragungsmethode, Präferenzen für zusätzliche Stimuli erhoben werden. Die so erhobenen 
Präferenzdaten gehen nicht in die Schätzung der Nutzenwerte ein, sondern werden aus- 
schließlich zur Validitätsprüfung herangezogen. 

Green/Srinivasan (1978) sprechen in diesem Zusammenhang von Kreuzvalidierung (vgl. 
S. 115). 

Vgl. hierzu auch Green/Srinivasan (1990), S. 13. 
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2.2.2.2 Bisherige empirische Vergleiche 

Tabelle 2-1 faßt die bisherigen Ergebnisse empirischer Vergleiche verschiedener 
Varianten der Conjoint- Analyse zusammen. Die Studien sind dabei nach den je- 
weils untersuchten Methoden und den eingesetzten Gütemaßen gegliedert. Die 
Systematisierung der Methoden nach Anzahl simultan zu beurteilender Stimuli 
wird auch an dieser Stelle beibehalten und die Tabelle in Anlehnung daran unter- 
gliedert. Die Hauptergebnisse der Studien werden jeweils zusammengefaßt, wo- 
bei Aussagen zur Signifikanz auf einem Signifikanzniveau von mindestens 10% 
(d.h. p<0,l) basieren. Teilweise werden die Gütemaße in den Untersuchungen auf 
verschiedene Arten operationalisiert. Sofern sich die Ergebnisse alternativer Ope- 
rationalisierungen hinsichtlich eines Kriteriums widersprechen, kann kein ein- 
deutiges Ergebnis abgeleitet werden. Dies wird bei der Ergebnisinterpretation 
berücksichtigt und innerhalb der Tabelle dokumentiert. Des weiteren sind in 
Tabelle 2-1 der Untersuchungsgegenstand, die Anzahl der betrachteten Eigen- 
schaften und der Stichprobenumfang der Studie angegeben, um mögliche syste- 
matische Einflüsse auf die Ergebnisse identifizieren zu können. Die letzte Spalte 
der Tabelle gibt Auskunft darüber, ob für die verschiedenen zu vergleichenden 
Methoden separate Stichproben befragt wurden (between-subject-design) oder ob 
die Probanden mehrere in der Studie untersuchten Methoden beantwortet haben 
(within-subject-design). Gegen ein solches within-subject-design spricht, daß die 
Ergebnisse sowohl durch Lern- als auch Reihenfolgeeffekte verzerrt werden kön- 



Vgl. z.B. Agarwal/Green (1991), S. 145, Huber et al. (1993), S. 1 10 und Johnson (1991), S. 
223. Angemerkt sei, daß die Problematik des Reihenfolgeeffekts bei einen within-subject 
Design an Gewicht verliert, sofern zwischen den einzelnen Befragungsschritten eine aus- 
reichend lange Zeitverzögerung auftritt (vgl. z.B. Huber/Herrmann/Gustafsson (2000), S. 
191). 
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Tabelle 2-1: Empirische Vergleichsstudien dekompositioneller Verfahren zur Präferenzmessung (Teil 1) 
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Tabelle 2-1: Empirische Vergleichsstudien dekompositioneller Verfahren zur Präferenzmessung (Teil 3) 
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a) keine Aussage zur Signifikanz; b) Befragt wurden Studierende 

c) Die Autoren berichten vereinzelt signifikante Unterschiede zwischen Eigenschaftsausprägungen 
Quelle: Eigene Erstellung in teilweiser Anlehnung an Sattler/Hensel-Bömer (2000), S. 128 f 




Der vorliegende Literaturüberblick zeigt insbesondere im Hinblick auf die ange- 
führten Argumente für die jeweiligen Methoden folgende zentrale Ergebnisse: 

1. Der Einsatz von Rating-Skalen bei der Abfrage von Präferenzen dominiert 
insbesondere in den neueren Studien relativ stark gegenüber der Anwendung 
einfacherer Ranking-Skalen. Die Ranking-Methode taucht hauptsächlich in 
Vergleichen mit dem Trade-Off- Verfahren auf. Ein Hauptargument, der Ra- 
ting-Methode den Vorzug zu geben, liegt in dem höheren Informationsgehalt 
und dem damit verbundenen Skalenniveau der Rating-Daten. Die darin ver- 
mutete Überlegenheit der Methode kann jedoch mit den vorliegenden empiri- 
schen Ergebnissen nicht eindeutig bestätigt werden. Während sowohl Ka- 
lish/Nelson (1991) als auch Leigh/MacKay/Summers (1984) keine signifi- 
kanten Unterschiede in der Prognosevalidität zwischen der Ranking- und Ra- 
ting-Variante nachweisen können, zeigen die Ergebnisse von Reynolds/Jolly 
(1980) auf eine signifikant höhere Reliabilität für die Ranking-Methode. Auch 
innerhalb der Gruppe mit nur 2 simultan zu beurteilenden Stimuli kann Stall- 
meier (1993) zeigen, daß die Vereinfachung von Paarvergleichen zu keinem 
nennenswerten Informationsverlust führt. Zum gleichen Ergebnis kommen 
Leigh/MacKay/Summers (1984). 

2. Die Choice-Based Conjoint Analysis wurde bisher fast ausschließlich mit der 
Rating-Methode aus der Gruppe “alle Stimuli” verglichen. Zwar treten (teil- 
weise signifikante) Unterschiede im Hinblick auf die diskriminierende Vali- 
dität zwischen den beiden Varianten Rating und Choice auf, aber alle Ergeb- 
nisse zur Prognosevalidität deuten darauf hin, daß sich diese Unterschiede in 
den geschätzten Präferenzstrukturen nicht auf die Prognosegüte der Verfahren 
auswirken. Lediglich Scott/Keiser (1984) berichten, daß die Choice- Variante 
hinsichtlich der externen Validität den Rating-Daten überlegen ist. Ob diese 
auch statistisch signifikant ist, wird nicht dokumentiert, zumal die Autoren 
nur eine sehr kleine Stichprobe befragt haben. Das Argument für die Choice- 
Variante, durch direkt beobachtetes Auswahl verhalten solches auch besser 
prognostizieren zu können, wird durch neuere empirische Ergebnisse nicht 
gefestigt. 

3. Ob die Trade-Off-Methode den dekompositioneilen Verfahren im eigentli- 
chen Sinn unterlegen ist, kann vor dem Hintergrund der bisherigen Ergebnisse 
abschließend nicht beurteilt werden. Zwar liegen eine Reihe von Vergleichs- 
studien (vor allem mit der Ranking-Methode) vor, jedoch sind die Ergebnisse 
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nicht eindeutig. So schneidet die (Voll-Profil-) Ranking-Methode in 3 Studien 
besser ab, gleichzeitig treten aber in entsprechend vielen Fällen keine Unter- 
schiede auf. Die Rating- Variante unterliegt sogar der Trade-Off-Methode bei 
dem einzigen Vergleich der beiden Methoden. Der stark zurückgehende Ein- 
satz der Trade-Off-Methode kann daher nicht eindeutig auf eine empirisch 
begründete Unterlegenheit zurückgeführt werden. Vielmehr kann davon aus- 
gegangen werden, daß diese traditionelle Form mittlerweile durch die Adapti- 
ve Conjoint Analysis (ACA) ersetzt wurde, die auf dem gleichen Prinzip ba- 
siert.**' 

Bei der Interpretation der Ergebnisse muß allerdings eingeräumt werden, daß die- 
se Hauptergebnisse nur als Tendenzen anzusehen sind. Ein abschließendes Urteil 
für eine Variante der dekompositioneilen Ansätze ist aufgrund dieses Literatur- 
überblicks nicht zulässig. Vor allem muß berücksichtigt werden, daß die Ergeb- 
nisse über die verschiedenen Studien hinweg nur bedingt vergleichbar sind. So 
sind die verschiedenen Beurteilungskriterien je nach Untersuchungsziel unter- 
schiedlich zu gewichten. Des weiteren differieren die Studien sowohl in der An- 
zahl zu beurteilender Eigenschaften, dem Untersuchungsgegenstand und der 
Stichprobe. Der Einfluß dieser Untersuchungsmerkmale auf die Ergebnisse eines 
Validitätsvergleichs ist nach wie vor unklar und darf nicht unterschätzt werden. 
So argumentieren beispielsweise Green/Krieger/Agarwal (1993), daß Variablen 
wie Stimulikonstruktion, Experimentdesign, Anleitungen für die Probanden oder 
das gewählte Validitätsmaß stärkeren Einfluß auf die Validitätsunterschiede zwi- 
schen Methoden ausüben als die untersuchten Methoden selbst.’ 

2.3 Vergleich zwischen der Self-Explicated-Methode und der 
Conjoint-Analyse 

Bisher wurden sowohl die Self-Explicated-Methode als auch die verschiedenen 
Varianten der Conjoint-Analyse separat betrachtet. Ziel der nachstehenden Aus- 
führungen ist es, diese beiden unterschiedlichen Ansätze zur Präferenzmessung 
einander gegenüberzustellen. Dabei werden die Self-Explicated-Methode und die 
Conjoint-Analyse ganzheitlich betrachtet, ohne die verschiedenen Varianten ex- 



Die Adaptive Conjoint Analysis (ACA) stellt eines der hybriden Verfahren dar, die in Ka- 
pitel 2.4 betrachtet werden. 

Vgl. Green/Krieger/Agarwal (1993), S. 378. 
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plizit zu berücksichtigen. Für dieses Vorgehen sprechen zweierlei Gründe. Zum 
einen werden an dieser Stelle die kompositioneilen und dekompositionellen Ver- 
fahren grundsätzlich diskutiert und die angeführten Argumente treffen in ihrer 
Tendenz für alle Varianten des jeweiligen Verfahrens gleichermaßen zu.‘^^ Der 
Aussagegehalt des Vergleichs wird folglich nicht maßgeblich eingeschränkt. Zum 
anderen lassen bisherige empirische Ergebnisse keine eindeutigen Aussagen zu. 
Weder bei den unterschiedlichen Formen der Self-Explicated-Methode noch bei 
der Conjoint- Analyse hat sich eine Gestaltungsform als eindeutig überlegen her- 
ausgestellt. Das Fehlen eindeutiger signifikanter Unterschiede bei bisherigen 
Untersuchungen zwischen den Varianten rechtfertigt somit eine zusammenge- 
faßte Betrachtung der beiden Verfahrensbereiche. Die vergleichende Diskussion 
der beiden Verfahren ist zweigeteilt. Zunächst erfolgt eine Gegenüberstellung 
anhand der in der Literatur angeführten theoretischen Argumente (vgl. Tabelle 2- 
2). Eine Zusammenfassung der Ergebnisse bei empirischen Vergleichen der bei- 
den Methoden zeigt dann, ob die theoretischen Vor- und Nachteile auch in der 
Anwendung in erwarteter Form zum Tragen kommen (vgl. Tabelle 2-3). 

2.3.1 Theoretischer Vergleich 

Als Grundlage der theoretischen Gegenüberstellung der Conjoint-Analyse und 
der Self-Explicated-Methode dienen die in der Literatur häufig angeführten Vor- 
und Nachteile der beiden Ansätze.''^ Bei der folgenden Darstellung werden die 
Argumente für und gegen ein Verfahren nach verschiedenen Kriterien systemati- 
siert. In einer tabellarischen Aufstellung werden sowohl die Ausprägungen der 
entsprechenden Kriterien bei jeder Methode aufgeführt, als auch die damit ver- 
bundenen positiven (+) oder negativen (-) Auswirkungen (vgl. Tabelle 2-2). 



Eine Ausnahme bildet hierbei das Trade-Off- Verfahren, das der Grundidee der Conjoint- 
Analyse nur bedingt gerecht wird. Da die dekompositioneile Vorgehensweise im eigentli- 
chen Sinn Gegenstand des folgenden Vergleichs ist, wird das Trade-Off- Verfahren als Va- 
riante der Conjoint-Analyse im Rahmen der theoretischen Diskussion ausgeklammert. 

Zu den Vor- und Nachteilen der beiden Verfahren vgl. Green/Srinivasan (1990), S. 9 f; 
Vriens (1995), S.7 und Sattler/Hensel-Börner (2000), S! 123 ff. Die folgenden Ausführun- 
gen beziehen sich, sofern nicht anders gekennzeichnet, auf diese Literaturangaben. 
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Tabelle 2-2: Theoretischer Vergleich zwischen der Conjoint- Analyse und der 
Self-Explicated-Methode 



Kriterium 


Conjoint-Analyse 

(dekompositionell) 


Self-Explicated-Methode 

(kompositioneil) 


Befragungsform 


indirekt 

+ Bewertung ganzheitlicher Produkte 
entspricht eher der realen Kaufsitua- 
tion 


direkt 

- Probleme bei der Definition des 
Konzepts „Wichtigkeit“ 

- Verzerrungen durch sozial er- 
wünschte Antworten 


Komplexität 


hoch 

- steigt mit zunehmender Anzahl an 
Eigenschaften 

- erfordert größeres Methodenwissen 
vom Marktforscher 

- erfordert hohe kognitive Fähigkeiten 
von den Probanden 


niedrig 

+ wesentlich unabhängiger von der 
Anzahl der Eigenschaften 
+ einfach zu implementieren 
+ geringe Anforderungen an die kogni- 
tiven Fähigkeiten der Probanden und 
das Methodenwissen der Marktfor- 
scher 


Anzahl 

Eigenschaften 


wenige (max. 6) 

- Gefahr von Vereinfachungsstrategien 
bei der Beantwortung 


viele 

+ auch geeignet bei Problemstellungen 
mit großer Anzahl an Eigenschaften 


Anwendbarkeit 
für Produkte mit 
hohem Inno- 
vationsgrad 


nur bedingt geeignet 

- Auswahl der relevanten Eigenschaf- 
ten problematisch, da diese bei In- 
novationen meist nicht bekannt 

- Anwendbarkeit nimmt mit zuneh- 
mendem Innovationsgrad ab 


besser geeignet 

+ Vorauswahl der relevanten Eigen- 
schaften nicht erforderlich, da insge- 
samt eine größere Anzahl an Eigen- 
schaften betrachtet werden kann 


Interviewformen 


persönlich 
schriftlich 
bedingt telefonisch 
online 


persönlich 

schriftlich 

telefonisch 

online 


Zeitaufwand 


hoch 

- höherer Zeitaufwand sowohl für die 
Konzeption als auch die Datenaus- 
wertung der Studie 

- längere Interviewzeiten 


niedrig 

+ Datenerhebung als auch Auswertung 
sind einfach und weniger zeitauf- 
wendig 


Kosten 


hoch 

- hohe Kosten meist durch persönliche 
Interviews bedingt 


niedrig 

+ niedrigere Kosten durch kürzere ggf. 
telefonische Interviews 


Modellannahmen 


flexibel 

+ Nicht-Linearität in der Teilnutzen- 
funktion kann berücksichtigt werden 


fest definiert 

- additives Teilnutzenmodell wird 
vorausgesetzt 


Berücksichtigung 
von Interaktions- 
effekten 


grundsätzlich möglich 

+ bei einem entsprechenden Experi- 
mentdesign ist die Ermittlung von 
Interaktionseffekten explizit möglich 


nur in Ausnahmefällen 

- bei isolierter Beurteilung einzelner 
Eigenschaften ist kein tatsächlicher 
Trade-Off erforderlich 

- Gefahr, daß redundante Eigenschaf- 
ten durch separate Bewertung dop- 
pelt gezählt werden 



Quelle: Eigene Erstellung 
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Ein wesentliches Unterscheidungsmerkmal der beiden Ansätze stellt die als ge- 
nau entgegengesetzt interpretierbare Befragungsform dar. Wie bereits erwähnt, 
basiert die Conjoint- Analyse als dekompositionelles Verfahren zur Ermittlung der 
Bedeutungsgewichte von Eigenschaften auf einer indirekten Befragung der Pro- 
banden. Die Bewertung ganzheitlicher Produkte oder Alternativen ist der realen 
Kaufsituation relativ ähnlich und erhöht dadurch den Realitätsbezug der Befra- 
gung. Demgegenüber werden bei der Self-Explicated-Methode die Probanden 
direkt nach der Wichtigkeit der einzelnen Eigenschaften gefragt. Die in der prak- 
tischen Anwendung zum Teil unklare Definition von „Wichtigkeit“ stellt aller- 
dings ein wesentliches Problem der Methode dar. Je nach Operationalisierung ist 
für die Probanden teilweise nicht eindeutig, was mit dem Konzept der Wichtig- 
keit gemeint ist. Eine weitere Gefahr der direkten Befragungsform liegt in mögli- 
chen Verzerrungen bei der Schätzung der Teilnutzenfunktionen. Häufig werden 
wichtige Eigenschaften unterschätzt und die Bedeutung von weniger wichtigen 
Eigenschaften überschätzt. Dieses Dilemma tritt insbesondere bei sozial er- 
wünschtem Antwortverhalten auf 

Zwar wird mit einer ganzheitlichen Betrachtung von Produkten der Realitätsbe- 
zug der Conjoint- Analyse im Vergleich zur Self-Explicated-Methode maßgeblich 
erhöht, jedoch ist damit auch eine wesentlich höhere Komplexität der Aufgaben- 
stellung verbunden. Die Beurteilungsaufgabe stellt hohe Anforderungen an die 
kognitiven Fähigkeiten der Probanden, da bei der Bewertung der Stimuli viele 
Informationen gleichzeitig verarbeitet werden müssen. Aber auch für den Markt- 
forscher erfordert die Konzeption einer Conjoint- Analyse umfangreiches Metho- 
denwissen sowohl für das Experimentdesign als auch für die abschließende Da- 
ten- und Ergebnisauswertung. Ein wichtiger Vorteil der Self-Explicated-Methode 
in diesem Zusammenhang ist ihre Einfachheit sowohl in der Implementierung als 
auch hinsichtlich der Anforderungen an die Probanden. Diese wird auch häufig 
als entscheidender Vorteil der Methode angeführt. Die Komplexität der Aufga- 
benstellung bei der Conjoint- Analyse wird zusätzlich von der Anzahl zu unter- 
suchender Eigenschaften beeinflußt. Werden die zu beurteilenden Stimuli durch 
(wesentlich) mehr als 6 Eigenschaften beschrieben, können Validitätsprobleme 
infolge einer Informationsüberlastung der Probanden auftreten. Um dieser Infor- 
mationsüberlastung entgegenzutreten, setzen Probanden meist unbewußt Verein- 
fachungsstrategien ein. Eine Form der Vereinfachung besteht darin, bei der Be- 
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urteilung der Stimuli lediglich auf eine Teilmenge der abzuwägenden Eigen- 
schaften zu achten. Solche Vereinfachungsstrategien können die Validität der 
Schätzergebnisse allerdings in hohem Maße beeinträchtigen. Im Gegensatz dazu 
ist das Self-Explicated-Modell auch für Problemstellungen mit vielen Eigen- 
schaften geeignet, denn der Grad der Komplexität ist insgesamt niedriger und 
wird weniger stark von der Zahl zu untersuchender Eigenschaften beeinflußt.*'^ 
Teilweise in Zusammenhang mit der Anzahl zu untersuchender Eigenschaften 
steht die Anwendbarkeit der Verfahren für innovative Produkte. Vorausset- 
zung jeder Variante der Conjoint- Analyse ist, daß alle relevanten Eigenschaften 
berücksichtigt werden. Je höher Jedoch der Innovationsgrad eines Produkts, desto 
weniger können diese a priori festgelegt werden. Da die Self-Explicated-Methode 
eine höhere Anzahl an Eigenschaften zuläßt, ist in ihrer Anwendung keine solche 
a priori Auswahl erforderlich. Sie ist damit für Produkte mit hohem Innovations- 
grad tendenziell besser geeignet."^ 

In Zusammenhang mit der Komplexität der Aufgabe sowohl für Marktforscher 
als auch für die Probanden steigt der Zeit- und damit verbunden der Kostenauf- 
wand, den der Einsatz einer Methode verursacht. So werden bei der Conjoint- 
Analyse häufig persönliche Interviews eingesetzt, was die Kosten der Befragung 
wesentlich erhöht. Dagegen kann aufgrund der Einfachheit der Abfrage eine di- 
rekte Befragung zur Wichtigkeit einzelner Eigenschaften wesentlich schneller 
und kostengünstiger, beispielsweise im Rahmen eines Telefoninterviews, durch- 
geführt werden.'*^ Die Interviewform hat also neben dem erforderlichen Zeit- 
aufwand bei der Datenerhebung und Analyse großen Einfluß auf die entstehen- 
den Kosten einer Studie zur Messung von Nachfragerpräferenzen. Unter diesen 



Einschränkend muß angemerkt werden, daß dieser Vorteil der Self-Explicated-Methode an 
Gewicht verliert, sofern bei der Conjoint-Analyse ein „Bridging“-Design angewendet wird. 
In diesem Fall kann auch bei der rein dekompositioneilen Conjoint-Analyse eine größere 
Anzahl an Eigenschaften betrachtet werden. 

Zur Anwendbarkeit der Verfahren bei Produkten mit hohem Innovationsgrad vgl. Clement 
(2000), S. 162 ff. 

* Srinivasan/Wyner ( 1 989) schlagen mit CASEMAP eine computergestützte Self-Explicated- 
Methode vor, die explizit für den Einsatz bei Telefoninterviews konzipiert wurde. 
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Anwendungsgesichtspunkten überwiegen die Vorteile der Self-Explicated- 
Methode eindeutig gegenüber der wesentlich komplexeren Conjoint- Analyse.'^® 

Aus methodischer Sicht zeichnet sich die Conjoint- Analyse durch eine wesentlich 
höhere Flexibilität aus. Während bei der Self-Explicated-Methode das additive 
Teilnutzenmodell als gültig vorausgesetzt wird, sind die Schätzergebnisse einer 
Conjoint- Analyse auch bei Gültigkeit eines multiplikativen Teilnutzenmodells 
konsistent. Durch diese Flexibilität der Modellannahmen stellen Fehlspezifika- 
tionen bei der Conjoint- Analyse ein weniger gravierendes Problem dar als bei 
den rein kompositioneilen Modellen. Ebenfalls flexibler ist die Conjoint- Analyse 
bei der Berücksichtigung von Interaktionseffekten. Während bei entsprechen- 
dem Experimentdesign Interaktionseffekte explizit ermittelt werden können, ist 
dies beim Self-Explicated-Verfahren nur in Ausnahmefällen möglich. Vielmehr 
wird durch die separate Beurteilung der einzelnen Eigenschaften den Probanden 
gar kein Trade-Off zwischen den Eigenschaften im eigentlichen Sinn abver- 
langt.*^* Mit der isolierten Bewertung ist zudem die Gefahr verbunden, daß re- 
dundante Eigenschaften doppelt oder noch häufiger gezählt werden und die Be- 
deutungsgewichte der Eigenschaften dadurch viel höher ausfallen, als sie tat- 
sächlich sind. 



Summiert man die angeführten positiven und negativen Auswirkungen für jede 
der beiden Methoden, zeigt sich tendenziell ein ausgeglichenes Bild. Inhaltliche 
und methodische Aspekte, so wie der Realitätsbezug der Aufgabenstellung oder 
die flexibleren Modellannahmen sprechen für den Einsatz der Conjoint- Analyse. 
Unter Implementierungs- und Anwendungsgesichtspunkten wie z.B. dem not- 



Es sei daraufhingewiesen, daß die Durchführung einer Conjoint-Analyse im Rahmen eines 
Telefoninterviews nicht prinzipiell ausgeschlossen ist. Sie ist dennoch auf den Einsatz von 
Paarvergleichen beschränkt, die zudem anhand möglichst weniger Eigenschaften beschrie- 
ben sein sollten (vgl. Moore (1992), S. 249). Diese Einschränkungen in der Konzeption des 
Conjoint-lnterviews sind vermutlich entscheidendes Kriterium dafür, daß diese Interview- 
form in der kommerziellen Anwendung von Conjoint-Analysen eine sehr untergeordnete 
Rolle spielt (vgl. Wittink/Cattin (1989), S. 92 und Wittink/Vriens/Burhenne (1994), 
S. 44). 

Mit dem Vorschlag von Srinivasan (1988), zunächst die wichtigste Eigenschaft zu identifi- 
zieren und diese als Ankerpunkt für die Wichtigkeit der anderen Eigenschaften zu verwen- 
den, wird eine relative Bewertung aller Eigenschaften vorgenommen (vgl. Srinivasan 
(1988), S. 296). Die Eigenschaften werden bei dieser Variante der Self-Explicated- 
Methode nicht mehr völlig isoliert voneinander betrachtet und die damit verbundenen 
Nachteile teilweise reduziert. 
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wendigen Zeitaufwand und entstehenden Kosten müßte dagegen der Self- 
Explicated-Ansatz favorisiert werden. Zwar wird die Einfachheit der kompositio- 
neilen Verfahren in der Literatur durchgängig als Hauptvorteil angeführt, jedoch 
beschränken sich die Anwendungsempfehlungen meist auf Problemstellungen 
mit einer großen Anzahl an Eigenschaften. Fast immer wird die Conjoint- Analyse 
aus theoretischer Sicht der Self-Explicated-Methode zumindest implizit als über- 
legen angesehen. Begründet wird dies vor allem mit der höheren Prognosegüte 
der Ergebnisse bedingt durch den stärkeren Realitätsbezug der Beurteilungsauf- 
gabe. Ob sich die diskutierten Probleme der Self-Explicated-Methode in erwar- 
teter Form nachteilig auf die Güte der Ergebnisse auswirken, kann empirisch 
überprüft werden. Ist dies nicht der Fall, wird das Argument hoher Zeit- und Ko- 
stenersparnis sowohl in der Datenerhebung als auch der Datenauswertung von 
zentraler Bedeutung sein. Einen ersten Schritt in diese Richtung stellt die folgen- 
de Zusammenfassung bisher durchgeführter empirischer Vergleiche zwischen der 
rein dekompositionellen Conjoint- Analyse und der Self-Explicated-Methode dar. 

2.3.2 Bisherige empirische Vergleiche 

In Anlehnung an Sattler/Hensel-Börner (2000) wird ein umfassender Überblick 
über bisherige Vergleichsstudien zwischen der Self-Explicated-Methode und der 
rein dekompositionellen Conjoint- Analyse gegeben. In der folgenden Übersicht 
werden zusätzlich aktuelle und in der deutschsprachigen Literatur veröffentlichte 
Studien diskutiert. Eine weitere Ergänzung betrifft eine Aufführung der Studien, 
welche die Methoden hinsichtlich der internen und diskriminierenden Validität 
vergleichen. Diese werden im Hinblick auf die im Rahmen der vorliegenden Ar- 
beit durchgeführte empirische Untersuchung einbezogen. Entsprechend der 
theoretischen Diskussion wird die Conjoint- Analyse insgesamt als dekompositio- 
nelles Verfahren gegenüber der Self-Explicated-Methode auf der anderen Seite 
betrachtet. Die unterschiedlichen Varianten werden aus den bereits oben ange- 



Dies wird bereits in der Darstellung der Vor- und Nachteile der Self-Explicated-Methode 
der meisten Autoren deutlich. Während die Einfachheit der Methode als Hauptargument in 
einem einführenden Satz erwähnt wird, folgt daran eine umfassende Auflistung aller 
Nachteile der Methode (vgl. hierzu Green/Srinivasan (1990), S. 9 f und Vriens (1995), 
S. 7). 

Die Abgrenzung der Gütemaße wurde ebenfalls an der im Rahmen dieser Arbeit durchge- 
führten Untersuchung orientiert. Aus diesem Grund kann es bei der Systematisierung zu 
Abweichungen im Vergleich zu Sattler/Hensel-Börner (2000) kommen. Zur Abgrenzung 
der Gütemaße vgl. Kapitel 2.2.2. 1 . 
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führten Gründen auch bei der Zusammenfassung der empirischen Ergebnisse 
nicht explizit differenziert. Die Studien sind daher in der Tabelle nach den einge- 
setzten Gütemaßen sortiert und innerhalb dieses Kriteriums chronologisch ange- 
ordnet. Durch Fettdruck hervorgehoben sind die Ergebnisse, die nach der theo- 
retischen Diskussion erwartet werden, d.h. die Ergebnisse, die hinsichtlich der 
Prognoseergebnisse eine Überlegenheit der Conjoint- Analyse aufweisen. Des 
weiteren sind in Tabelle 2-3 der Untersuchungsgegenstand, die Anzahl unter- 
suchter Eigenschaften sowie der Stichprobenumfang angegeben, um wiederum 
mögliche systematische Einflüsse dieser Untersuchungsmerkmale auf die Ergeb- 
nisse identifizieren zu können. 



Sofern einzelne Studien Ergebnisse zu verschiedenen Gütemaßen liefern, kann es zu Mehr- 
fachnennung einer Studie in der Tabelle kommen. 
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Tabelle 2-3: Empirische Vergleiche zwischen Conjoint- Analyse und Self-Explicated-Methode (Teil 2) 
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Tabelle 2-3: Empirische Vergleiche zwischen Conjoint- Analyse und Self-Explicated-Methode (Teil 3) 
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a) keine Aussage zur Signifikanz 

b) Befragt wurden Studierende 

c) Einzige Ausnahme, bei der die Trade-Off Conjoint Analysis mit der Self-Explicated-Methode verglichen wurde 

d) Stichprobenumfang variiert, da Vergleich über 2 verschiedene Untersuchungen gemacht wird 
Quelle: Eigene Erstellung in teilweiser Anlehnung an Sattler/Hensel-Bömer (2000), S. 128 f 



Vergleiche hinsichtlich der diskriminierenden Validität zeigen in 3 von 4 Fäl- 
len, daß je nach Methode unterschiedliche Präferenzstrukturen ermittelt werden. 
Dieses Ergebnis impliziert, daß die Art der Befragung die ermittelten Präferenz- 
strukturen beeinflußt. Ob die Ergebnisse der Conjoint- Analyse wie erwartet die 
valideren sind und den tatsächlichen Präferenzstrukturen der Probanden näher 
kommen, kann anhand dieses Kriteriums nicht beurteilt werden. Die diskriminie- 
rende Validität läßt lediglich eine Aussage zu Unterschieden zwischen den Er- 
gebnissen zu. Von größerer Bedeutung sind daher die Vergleiche hinsichtlich der 
anderen Gütekriterien. 

Für jede Datenerhebungsmethode kann mit der Reliabilität die Konsistenz des 
Antwortverhaltens der Probanden geprüft werden. Die Ergebnisse sind diesbe- 
züglich eindeutig. Bei allen 3 vorliegenden Vergleichen fuhrt die Self- 
Explicated-Methode zu reliableren Ergebnissen. Dies stärkt das Argument, daß 
ein höherer Grad an Komplexität konsistentes Verhalten der Probanden er- 
schwert. Bei einer einfacheren Aufgabe wie der Beurteilung einzelner Eigen- 
schaften fällt es den Probanden dagegen leichter, konsistent zu antworten. Deut- 
lich wird zudem, daß dieses Ergebnis von der Anzahl untersuchter Eigenschaften 
nicht beeinflußt wird. Nicht nur bei relativ vielen Eigenschaften (8 bzw. 10) ist 
die Self-Explicated-Methode der Conjoint- Analyse überlegen, sondern bereits bei 
nur 5 Eigenschaften schneidet letztere deutlich schlechter ab.'^^ 

Im Gegensatz zur Reliabilität testet die interne Validität, inwieweit das Ant- 
wortverhalten der Probanden durch das Modell erklärt werden kann. Sie gibt an, 
wie gut sich die empirisch geschätzten Präferenzen an die tatsächlich beobachte- 
ten Präferenzen anpassen. Diesbezüglich weisen bisherige empirische Befunde 
darauf hin, daß die Self-Explicated-Methode mindestens zu genauso guten Er- 
gebnissen fuhrt wie die rein dekompositioneile Conjoint- Analyse. Berücksichtigt 
man bei der Interpretation dieser Ergebnisse, daß für die Self-Explicated- 
Methode dieser Vergleich über einen Test der internen Validität im engeren Sin- 



Auf eine Hervorhebung dieser erwarteten Ergebnisse in Tabelle 2-3 wurde verzichtet, da 
lediglich die Befunde hinsichtlich der Prognosegüte verdeutlicht werden sollen. 

Es sei an dieser Stelle angemerkt, daß ein Vergleich zwischen der Conjoint- Analyse mit 
der Self-Explicated-Methode, zumindest für letztgenannte, sogar über eine Prüfung der in- 
ternen Validität im engeren Sinne hinausgeht. Für die Self-Explicated-Methode stellt dies 
bereits eine Prüfung der Prognosevalidität dar, da in den betrachteten Studien jeweils die 
beobachteten Präferenzen der Conjoint-Aufgabe prognostiziert wurden. 
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ne hinausgeht, gewinnt das gute Abschneiden des Verfahrens zusätzlich an Be- 
deutung. 

Von besonderem Interesse für den Einsatz einer Methode zur Präferenzmessung 
ist deren Eignung, Präferenzen fiir alternative, vor allem neue Produkte progno- 
stizieren zu können. Auf Basis der theoretischen Argumentation sprechen die 
Vorteile überwiegend für die dekompositioneile Vorgehensweise. Analysiert man 
diesbezüglich bisherige Forschungsergebnisse, zeigt sich dagegen keine eindeuti- 
ge Überlegenheit der Conjoint-Analyse. Während sich im Hinblick auf die Pro- 
gnosegüte für knapp die Hälfte der Vergleiche eine (z.T. signifikant) höhere Pro- 
gnosevalidität für die Conjoint-Analyse ergab, kann in entsprechend vielen Fäl- 
len kein Unterschied zwischen den Verfahren nachgewiesen oder keine eindeuti- 
ge Aussage gemacht werden. Prüft man die Prognosegüte anhand der externen 
Validität, also bezüglich tatsächlicher Entscheidungen, die unabhängig von der 
Befragung getroffen wurden, schneidet die Conjoint-Analyse deutlich schlechter 
ab als die Self-Explicated-Methode. In allen 3 Studien, die dieses Gütemaß zur 
Beurteilung heranziehen, ist die Self-Explicated-Methode gleich gut oder der 
Conjoint-Analyse sogar überlegen. 

Diese Ergebnisse können insgesamt nur unzureichend durch die Besonderheiten 
der einzelnen Untersuchungen begründet werden. Weder in bezug auf das Unter- 
suchungsobjekt noch auf die Stichprobe kann ein systematischer Einfluß abge- 
leitet werden. Gleiches gilt für die Anzahl berücksichtigter Eigenschaften. Selbst 
bei gleicher Anzahl an Eigenschaften widersprechen sich die Befunde. 
Akaah/Korgaonkar (1983), Green/Helson (1989) sowie Agarwal/Green (1991) 
betrachten jeweils 6 Eigenschaften und berichten widersprüchliche Ergebnisse. 
Außerdem können Pullman/Dodson/Moore (1999) zeigen, daß bei Berücksichti- 
gung von 17 Eigenschaften die Conjoint-Analyse zu signifikant höherer Progno- 
sevalidität führt als die Self-Explicated-Methode. Umgekehrt schneidet sie in an- 
deren Studien bereits bei 5 Eigenschaften schlechter ab als die Self-Explicated- 
Methode.’^^ Zudem sei angemerkt, daß die Self-Explicated-Methode und die 



Vgl. hierzu die Studien von Huber/Danesghar/Ford (1971), Srinivasan (1988), Leigh/ 
MacKay/Summers (1984). 
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Conjoint- Analyse auf Basis der angeführten Argumente ganzheitlich betrachtet 
wurden. Eine Aussage über systematische Einflüsse der eingesetzten Variante der 
beiden Verfahren ist dadurch nicht möglich. Da bisher keine eindeutigen (signifi- 
kanten) Unterschiede zwischen den einzelnen Varianten nachgewiesen werden 
konnten (vgl. Abschnitt 2.1 und 2.2), liegt die Vermutung nahe, daß auch dieser 
Einflußfaktor keine Erklärung für die vorliegenden Ergebnisse liefert. Das Ge- 
samtergebnis muß dennoch vor dem Hintergrund eines möglichen Informations- 
verlustes durch die zusammengefaßte Betrachtung interpretiert werden. 

Insgesamt lassen 20 Befunde einen direkten Vergleich der beiden Ansätze zur 
Präferenzmessung hinsichtlich verschiedener Gütemaße zu.'^^ Bei diesen 20 Ver- 
gleichen kann nur in 6 (30%) Fällen eine (nur teilweise signifikante) Überlegen- 
heit der Conjoint- Analyse nachgewiesen werden. Fast genauso oft (25% der Fäl- 
le) schneidet die Self-Explicated-Methode besser ab und weitere 8 Studien zeigen 
keine Unterschiede in der Ergebnisgüte bzw. lassen keine eindeutige Aussage zu. 
Bereits vor dem Hintergrund dieser Ergebnisse muß der dominante Einsatz der 
rein dekompositioneilen Conjoint- Analyse insbesondere in der praktischen An- 
wendung kritisch hinterfragt werden. Auch wenn zahlreiche Argumente und 
Vorteile für das dekompositionelle Vorgehen sprechen, kann diese Überlegenheit 
insbesondere bei der Prognose von tatsächlichem KaufVerhalten empirisch bisher 
nicht belegt werden. Vielmehr führen die wesentlich einfacheren Self-Explicated- 
Verfahren zu vergleichbaren oder teilweise besseren Ergebnissen und stellen vor 
allem unter dem Aspekt der Implementierung und unter Zeit- und Kostenge- 
sichtspunkten in der Durchführung durchaus eine Alternative dar. Offen ist an 
dieser Stelle noch, ob diese Aussage auch im Vergleich zu hybriden, insbesonde- 
re den neueren computergestützten Conjoint- Varianten bestehen bleiben kann. 
Eine entsprechende Prüfung wird nach der Darstellung hybrider Verfahren 
durchgefuhrt. 



Nicht berücksichtigt in dieser Zusammenfassung sind die Vergleiche hinsichtlich der dis- 
kriminierenden Validität, da diese keinen direkten Vergleich zugunsten einer der beiden 
Methoden zulassen. 
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2.4 Hybride Verfahren 

Entsprechend den Ausführungen zu den kompositionellen sowie dekompositio- 
neilen Verfahren sollen an dieser Stelle die hybriden Ansätze zur Präferenzmes- 
sung in erster Linie systematisiert werden. Schwerpunkt der Systematisierung 
ist, die verschiedenen Varianten entsprechend ihrer konzeptionellen Besonder- 
heiten voneinander abzugrenzen. Allen hybriden Verfahren ist gemein, daß die 
Datenerhebung sowohl einen kompositioneilen (Self-Explicated-Phase) als auch 
einen dekompositioneilen (Conjoint-Phase) Interviewteil umfaßt. Die beiden 
Vorgehensweisen werden mit dem Ziel kombiniert, die jeweiligen Vorteile der 
einzelnen Schritte auszunutzen. Welche Variante der Self-Explicated-Methode 
bzw. der Conjoint-Analyse zum Einsatz kommt, ist unterschiedlich. Von größerer 
Bedeutung für die Abgrenzung der hybriden Ansätze ist, wie diese beiden Ver- 
fahrensschritte aufeinander abgestimmt werden. Dabei kann der Conjoint-Teil 
unabhängig von der Self-Explicated-Befragung und damit a priori konzipiert 
werden. Adaptive hybride Conjoint- Analysen dagegen setzen die aus der Self- 
Explicated-Phase gewonnenen Informationen ein, um den Conjoint-Teil der Be- 
fragung individuell auf den Probanden abzustimmen. Unter dem Begriff “adap- 
tiv” werden im Rahmen dieser Arbeit alle Verfahren subsumiert, bei denen die 
Gestaltung eines zweiten Befragungsteils an die Antworten aus einer ersten In- 
terviewphase angepaßt wird. Diese Begriffsabgrenzung wird dabei unabhängig 
vom Ausmaß der Anpassungen vorgenommen. Abhängig von der eingesetzten 
Conjoint- Variante kann diese Anpassung unterschiedlich stark ausgeprägt sein.’^' 
Mit dieser Begriffsabgrenzung werden somit auch individualisierte bzw. „custo- 
mized“ Ansätze als adaptive Verfahren betrachtet. Abbildung 2-4 gibt einen 
Überblick über hybride Ansätze zur Präferenzmessung. 



129 • • 

Die im Rahmen dieser Arbeit untersuchten Verfahren werden in Kapitel 3 ausführlich dar- 
gestellt. 

Die Vor- und Nachteile der beiden unterschiedlichen Vorgehensweisen wurden in Kapitel 
2.3.1 diskutiert. 

Vgl. hierzu Kapitel 3. 

Es sei zudem angemerkt, daß auch in der bisherigen Literatur diese Begriffe nicht eindeutig 
voneinander abgegrenzt sind. So wird beispielsweise die Vorgehensweise der Adaptive 
Conjoint Analysis (ACA) im Handbuch zur Software mit „...customizing the interviews for 
each respondent ...“ beschrieben (vgl. Metegrano (1994), S. 1-3). 
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Abbildung 2-4: Systematisierung hybrider Ansätze 




2.4.1 Nicht adaptive hybride Verfahren 

Ziel einer hybriden Methode ist es, auch bei Einsatz einer dekompositioneilen 
Vorgehensweise, eine möglichst große Anzahl an Eigenschaften in einer Unter- 
suchung berücksichtigen zu können. Während die traditionelle Voll-Profil- 
Methode auf max. 6 Eigenschaften beschränkt ist,’^"' sind bei kommerziellen An- 
wendungen in den meisten Fällen wesentlich mehr Eigenschaften untersuchungs- 
relevant. Grundgedanke der traditionellen hybriden Vorgehensweise ist daher, 
die zu beurteilenden Stimuli der Conjoint-Phase auf mehrere Probanden aufzu- 
teilen und dadurch einer Überforderung der Probanden vorzubeugen. Während 
jede Testperson in einer Self-Explicated-Phase alle Eigenschaften bewertet, wird 
ihr im Conjoint-Teil lediglich eine Teilmenge aller kombinierten Stimuli vorge- 
legt. Die Stimuli werden dabei einem sog. Masterdesign entnommen und in ei- 
nem ausgeglichenen Verhältnis auf die verschiedenen Probanden aufgeteilt. Die 
Datenauswertung des Verfahrens basiert dann auf dem Prinzip, Probanden mit 
einer ähnlichen Nutzenstruktur (ermittelt aus der Self-Explicated-Phase) zu ho- 



Einen umfassenden Überblick zur Vorgehensweise hybrider Conjoint-Analysen gibt Green 
(1984). 

Vgl. Green/Srinivasan (1990), S. 8. 

Vgl. Green (1984), S. 156. 

Das Hauptproblem einer großen Anzahl an Eigenschaften liegt darin, daß für die stabile 
Schätzung der Teilnutzenwerte sehr viele Stimuli konstruiert und damit auch bewertet 
werden müssen. 
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mogenen Gruppen zusammenzufassen und die Conjoint-Daten segmentweise 
auszuwerten. Die individuellen Nutzenfunktionen auf Basis der Self-Explicated- 
Befragung werden auf diese Weise um einen segmentspezifischen Modellteil er- 
weitert. 

Neben dieser grundsätzlichen Konzeption der hybriden Verfahren treten je nach 
Autor Modifikationen dahingehend auf, welche Varianten der Self-Explicated- 
Methode oder Conjoint- Analyse eingesetzt werden. Die Gestaltungsspielräume 
seien an folgenden Beispielen verdeutlicht. Während bei Green/Goldberg/ 
Montemayer (1981) in der Self-Explicated-Phase sowohl die Eigenschaftsausprä- 
gungen beurteilt als auch die Wichtigkeit der Eigenschaften erhoben werden 
(gewichtete Self-Explicated-Methode),’^^ umfaßt der Self-Explicated-Teil der 
Huber-Hybrid- Variante ausschließlich eine Bewertung der Ausprägungen. Die 
Wichtigkeit der Eigenschaften wird anschließend durch Regression bestimmt, 
wobei die Bewertungen der Ausprägungen als unabhängige und die Bewertungen 
für die Gesamtkonzepte der Conjoint-Phase als abhängige Variable in die Schät- 
zung eingehen.’^^ Während in der Conjoint-Phase in den meisten Studien bisher 
der Einsatz einer Ranking- oder Rating-Aufgabe überwiegt, ist grundsätzlich 
auch hier ein alternatives Vorgehen denkbar. Moore/Gray-Lee/Louviere (1998) 
beispielsweise verbinden echte Auswahlentscheidungen einer Choice-Based 
Conjoint- Analyse mit zuvor erhobenen Self-Explicated-Daten und sprechen von 
einem hybriden Choice-Modell.'^^ 

Mit der Aufteilung aller Stimuli auf verschiedene Probanden geht allerdings die 
Möglichkeit einer individuellen Schätzung der Teilnutzen werte allein auf Basis 
der Conjoint-Daten verloren. Für jeden Probanden werden lediglich Präferenzen 
gegenüber einem Teil aller zu bewertenden Stimuli erhoben. Dies liefert keine 
ausreichende Datenmenge, um individuelle Nutzenfunktionen schätzen zu kön- 
nen. Um dieses Defizit der traditionellen hybriden Verfahren zu beheben, wurden 
von Green/Krieger (1996) und Baier/Säuberlich (1997) neuere Schätzmethoden 
vorgeschlagen, die eine vollständig individualisierte Auswertung hybrider Con- 



Vgl. Green/Goldberg/Montemayer (1981), S. 34. 

Vgl. Hoepfl/Huber (1970), S. 41 1; Huber/Daneshgar/Ford (1971), S. 271. Zur Abgrenzung 
zwischen Huber- und Green-Hybrid vgl. auch Akaah/Korgaonkar (1983), S. 187 f 
Vgl. Moore/Gray-Lee/Louviere (1998), S. 197. 
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joint- Analysen ermöglichen. Dabei werden sowohl die Self-Explicated-Daten als 
auch die Conjoint-Daten auf individuellem Niveau ausgewertet. 

2.4.2 Adaptive hybride Ansätze 

2.4.2.1 Nicht computergestützte Verfahren 

Sowohl die Handhabung vieler Eigenschaften als auch eine individuelle Schät- 
zung der Teilnutzenwerte separat für die Self-Explicated-Phase und die Conjoint- 
Phase ermöglichen die adaptiven hybriden Conjoint-Analysen. Der Ansatzpunkt 
zur Berücksichtigung vieler Eigenschaften liegt nicht in der Reduzierung der 
Stimuli für jede Person, sondern hauptsächlich in der Identifikation der für den 
Conjoint-Teil tatsächlich relevanten Eigenschaften. Statt in der Self-Explicated- 
und der Conjoint-Phase jeweils alle Eigenschaften beurteilen zu lassen, werden in 
der letzteren nur die für die Auskunftsperson wichtigsten Eigenschaften inte- 
griert.*'^^ Srinivasan/Park (1997) schlagen mit der Customized Conjoint Analy- 
sis (CCA) eine Methode vor, bei der in einem Self-Explicated-Interview alle Ei- 
genschaften bewertet werden. Aufbauend auf den Antworten in diesem ersten 
Interviewteil werden anschließend für jeden Probanden die individuell wichtig- 
sten Eigenschaften identifiziert und in einer zweiten Befragung - dem Conjoint- 
Interview - ein zweites Mal beurteilt. Für beide Befragungsschritte werden Nut- 
zenfunktionen für die Eigenschaften auf individuellem Niveau ermittelt und ge- 
mäß einer Optimalitätsbedingung anschließend mit denen der Self-Explicated- 
Phase kombiniert. Da es sich bei der CCA um eine schriftliche Befragung han- 
delt, ist zwischen den beiden Befragungen eine Zeitverzögerung erforderlich, um 
die Stimuli gemäß den Antworten aus dem Self-Explicated-Teil individuell zu 
konstruieren. Eine solche wiederholte Befragung der Probanden erhöht allerdings 
den Erhebungsaufwand und die damit verbundenen Kosten.*'*^ Zudem kann nicht 
ausgeschlossen werden, daß sich die Präferenzen der Probanden über die Zeit 
verändert haben. 



Eine ausführliche Darstellung der Schätzmodelle findet sich bei Green/Krieger (1996), S. 
854 ff und bei Baier/Säuberlich (1997), S. 955 ff 

Dieses Vorgehen ist ähnlich der von Schweikl (1985) vorgeschlagenen Idee zur Individua- 
lisierung der Conjoint-Analyse. Der wesentliche Unterschied besteht darin, daß es sich bei 
Schweikl nicht um ein hybrides Verfahren handelt, sondern lediglich nicht relevante Ei- 
genschaften aus der weiteren Betrachtung ausgeschlossen werden. Informationen zu deren 
Bedeutung werden nicht mehr erhoben. 

Vgl. Srinivasan/Park (1997), S. 287. 
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2.4.1.2 Computergestützte Verfahren 

Eine unmittelbare Anpassung des Conjoint-Teils an vorangegangene Inter- 
viewschritte ist mit Hilfe eines computergestützten Verfahrens möglich. Die 
bekannteste und am weitesten verbreitete Methode ist die Adaptive Conjoint 
Analysis (ACA) von Johnson (1987). In einem vollständig computergestützten 
Interview werden nach einem Self-Explicated-Teil im dekompositionellen Teil 
Paarvergleiche (Graded Paired Comparisons) abgefragt, deren Konstruktion je- 
weils an vorangegangene Antworten angepaßt wird. Die ACA ist bisher die ein- 
zige kommerzielle Software für adaptive hybride Verfahren. Zweifelsohne hat 
sie sich weitestgehend zum Standardinstrument bei der Messung von Präferenzen 
etabliert. Gleichwohl wird der Einsatz von Paarvergleichen zum einen aufgrund 
der Ineffizienz in der Datenerhebung häufig kritisiert und spielt bei der Gestal- 
tung rein dekompositioneller Conjoint- Analysen eine sehr untergeordnete Rol- 
le.’^^ 

Vor diesem Hintergrund werden mit der vorliegenden Arbeit neue adaptive Ver- 
fahren vorgeschlagen und der Bereich computergestützter hybrider Verfahren 
erweitert. Während die neuen Verfahren in Kapitel 3 ausführlich dargestellt wer- 
den, soll an dieser Stelle bereits deren Einordnung und Zusammenhang mit be- 
reits bekannten Ansätzen vorgenommen bzw. verdeutlicht werden. Mit der Cu- 
stomized Computerized Conjoint Analysis (CCC) wird ein in Anlehnung an 
die CCA konzipiertes Verfahren vorgestellt, bei der Stimuli in der Conjoint- 
Phase alle simultan zu bewerten sind. Bei der Choice-Oriented Individualized 
Conjoint Analysis (CHIC) werden den Probanden jeweils Teilmengen aller zu 
beurteilenden Stimuli gleichzeitig präsentiert. Als eine Aufgabe wird den Pro- 
banden eine Auswahlentscheidung abverlangt, um analog zur Choice-Based 
Conjoint Analysis die Beurteilungsaufgabe so nah wie möglich an der tatsächli- 
chen Kaufsituation zu orientieren. Mit dieser Erweiterung werden im Bereich 
computergestützter hybrider Verfahren alle drei vorgestellten Gruppen dekompo- 



Carmone/Schaffer (1995), S. 117. 

Wittink/Cattin (1989) berichten, daß nur in 10% aller kommerziellen Anwendungen in den 
USA Paarvergleiche eingesetzt werden, (vgl. Wittink/Cattin (1989), S. 93). In einer ent- 
sprechenden Untersuchung für Europa wird dieser Trend noch deutlicher. Lediglich in 4% 
bzw. 5% aller kommerziellen Conjoint-Studien kommen Paarvergleiche (abgesehen von 
der ACA) zum Einsatz (vgl. Wittink/Vriens/Burhenne (1994), S. 44). 
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sitioneller Varianten („alle Stimuli“, „Teilmenge an Stimuli“, „zwei Stimuli“) 
berücksichtigt: 



Abbildung 2-5: Zusammenhang zwischen den dekompositioneilen und compu- 
tergestützten hybriden Verfahren 



Anzahl 
simultan zu 
beurteilende 
Stimuli 


Dekompositionelle 

Verfahren 


Computergestützte 
hybride Verfahren 


Alle 


•traditionelle Conjoint-Analyse _ 
mit Ranking oder Rating-Aufgabe 


^ Customized Computerized 
^ Conjoint Analysis (CCC) 


Teilmenge 


•Choice-Based Conjoint Analysis ™ 


^ Choice-Oriented Individualized 
Conjoint Analysis (CHIC) 


Zwei 


• Paarvergleiche 
•Graded Paired Comparison 


^ Adaptive Conjoint 
^ Analysis (ACA) 



Quelle: Eigene Erstellung 



Empirische Vergleiche innerhalb des hybriden Verfahrenszweiges wurden bis- 
her relativ wenige durchgefiihrt.^'^^ So liefern Akaah/Korgaonkar (1983) den bis- 
her einzigen expliziten Vergleich innerhalb nicht adaptiver Verfahren zwischen 
Green- und Huber-Hybrid. Als Ergebnis berichten die Autoren, daß die Unter- 
schiede hinsichtlich der Prognosegüte sehr gering sind und zudem je nach Mo- 
dellstruktur unterschiedlich ausfallen.*'^^ Ebenso wird die ACA bisher erst einmal 
mit einer nicht adaptiven hybriden Variante in einer Studie von Pull- 
man/Dodson/Moore/(1999) verglichen. Die Ergebnisse dieser Untersuchung zei- 
gen, daß keine signifikanten Unterschiede zwischen der ACA und einem traditio- 
nellem hybriden Verfahren auftreten bzw. unter Berücksichtigung von „con- 
straints“ bei der Schätzung des hybriden Modells, dieses zu einer signifikant hö- 
heren Prognosevalidität fuhrt als die ACA.‘"^^ Für die empirische Studie der vor- 
liegenden Arbeit wurde ein umfangreicher Pretest durchgeführt, der gleichzeitig 
einen ersten empirischen Vergleich zwischen den computergestützten hybriden 



Es sei darauf hingewiesen, daß Vergleiche zwischen alternativen Auswertungsmethoden 
wie sie z.B. von Green/Krieger (1996) durchgeführt werden, nicht Gegenstand der Be- 
trachtung sind, da Schwerpunkt der vorliegenden Arbeit die Datenerhebungsmethode ist. 
Vgl. Akaah/Korgaonkar (1983), S. 194. 

Vgl. Pullman/Dodson/Moore ( 1 999), S. 131. 
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Verfahren CCC und ACA liefert. Dabei schneidet die CCC hinsichtlich der Pro- 
gnosevalidität (teilweise signifikant) besser ab als die ACA.'"*^ 

Die insgesamt geringe Anzahl empirischer Vergleiche läßt sich zumindest teil- 
weise damit begründen, daß eine Gegenüberstellung der hybriden Verfahren mit 
der rein kompositioneilen und rein dekompositioneilen Vorgehensweise von grö- 
ßerem Interesse ist. Im folgenden Abschnitt 2.5 wird eine entsprechende Analyse 
vorgenommen. 

2.5 Vergleich hybrider Verfahren mit anderen Ansätzen zur 
Präferenzmessung 

Wie bereits erläutert, werden bei den hybriden Verfahren ein Self-Explicated-Teil 
und ein Conjoint-Teil mit dem Ziel kombiniert, die Vorteile beider Verfahren 
auszunutzen. Eine Diskussion der theoretischen Vor- und Nachteile anhand der in 
Kapitel 2.3.1 definierten Kriterien fuhrt zu dem Ergebnis, daß die hybriden Ver- 
fahren hinsichtlich ihrer Ausprägung der verschiedenen Kriterien jeweils zwi- 
schen den beiden gegensätzlichen Ansätzen liegen. So können beispielsweise bei 
einem hybriden Verfahren mehr Eigenschaften betrachtet werden als bei der rein 
dekompositioneilen Conjoint- Analyse, aber nach wie vor weniger als bei der 
Self-Explicated-Methode. Auf eine erneute Diskussion der theoretischen Vor- 
und Nachteile der verschiedenen Ansätze wird daher an dieser Stelle verzichtet 
und der Schwerpunkt auf die Auswertung bisheriger empirischer Ergebnisse ge- 
legt. Diese können zeigen, ob es durch die Kombination der beiden Befragungs- 
teile tatsächlich gelingt, die Schwachstellen der beiden Methoden für sich zu 
überwinden und die jeweiligen Vorteile auszunutzen. Ist dies der Fall, müßte sich 
eine Überlegenheit der hybriden Verfahren im Vergleich sowohl zur rein dekom- 
positioneilen Conjoint- Analyse als auch der Self-Explicated-Methode hinsichtlich 
der Güte der Ergebnisse zeigen. 

2.5.1 Bisherige empirische Vergleiche zwischen hybriden Verfah- 
ren und der rein dekompositioneilen Conjoint-Analyse 

Entsprechend der Vorgehensweise in den vorangestellten Kapiteln werden die 
Befunde wieder nach den jeweils verglichenen Methoden angeordnet. Auch hier 
wird die Systematisierung der Verfahren beibehalten und Tabelle 2-4 entspre- 



Vgl. Hensel-Börner/Sattler (2000), S. 15 ff. 
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chend unterteilt. Sofern in einer Studie mehrere Methoden verglichen wurden, 
kann es zu Mehrfachnennungen dieser Studie kommen, da die vorgenommenen 
Vergleiche immer paarweise betrachtet werden. Hervorgehoben sind wieder die 
Ergebnisse, die auf Basis der Konzeption der hybriden Verfahren mit den theore- 
tischen Erwartungen konform gehen. Dementsprechend sind die Ergebnisse fett 
gedruckt, bei denen mit den hybriden Verfahren eine höhere Validität gegenüber 
der rein dekompositioneilen Conjoint- Analyse erzielt wurde. Ein solches Ergeb- 
nis kann gerade deshalb vermutet werden, weil mit der hybriden Vorgehensweise 
vor allem die Komplexität im Conjoint-Teil reduziert wird. Gleichzeitig wird ein 
höherer Realitätsbezug als bei der Self-Explicated-Methode allein sichergestellt. 
Da die mit der Komplexität der Aufgabenstellung bei der Conjoint- Analyse ver- 
bundenen Probleme vor allem bei vielen Eigenschaften zum Tragen kommen, 
müßte sich gerade in diesen Fällen eine Überlegenheit der hybriden Verfahren 
zeigen. 
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Tabelle 2-4: Empirische Vergleiche zwischen hybriden Verfahren und der Conjoint- Analyse (Teil 1) 
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Tabelle 2-4: Empirische Vergleiche zwischen hybriden Verfahren und der Conjoint- Analyse (Teil 2) 




a) keine Aussage zur Signifikanz 

b) Befragt wurden Studierende 



























Faßt man zunächst die Ergebnisse bzgl. aller Gütemaße bei den Vergleichen der 
Conjoint- Analyse mit den traditionellen hybriden Verfahren zusammen, weisen 
letztere nur in 2 der 8 Studien eine höhere Validität auf. Bei den übrigen Verglei- 
chen treten keine Unterschiede auf bzw. variieren die Ergebnisse über die Krite- 
rien. Teilweise schneidet die rein dekompositioneile Conjoint- Analyse sogar bes- 
ser ab. Dabei wurde in der Mehrzahl der Studien mit einem within-subject-design 
gearbeitet. In einigen Fällen wurde sogar für die reinen Conjoint-Daten lediglich 
der zweite Befragungsteil der hybriden Datenerhebung ausgewertet. Die Ergeb- 
nisse deuten folglich darauf hin, daß die zusätzlich gewonnenen Informationen 
durch den Self-Explicated-Teil kaum eine Verbesserung in der Prognosegüte be- 
wirken. Vielmehr können durch Auswertung nur eines Teils der gewonnenen 
Daten vergleichbare Prognoseergebnisse erzielt werden. 

Diese Tendenz zeigt sich in ähnlicher Form bei einem Vergleich der Conjoint- 
Analyse mit der ACA. Bei 4 von 7 direkten Vergleichen fuhrt die Conjoint- 
Analyse zu einer signifikant höheren Prognosevalidität. In einem weiteren Fall 
kann keine eindeutige Aussage gemacht werden und nur zweimal ist die ACA der 
rein dekompositioneilen Conjoint- Analyse überlegen. Ob die höhere Reliabilität 
der ACA in der Studie von Green/Krieger/Agarwal (1993) durch den Self- 
Explicated-Teil zurückzuführen ist, kann nur vermutet werden, würde aber den 
bisherigen Ergebnissen entsprechen. Die Self-Explicated-Verfahren wiesen in 
den bereits ausgewerteten Studien durchweg eine höhere Reliabilität auf als die 
Conjoint-Analyse. 

Zusammenfassend deutet eine Gegenüberstellung der hybriden Verfahren mit der 
rein dekompositionellen Conjoint-Analyse darauf hin, daß die Erweiterung des 
Ansatzes um einen kompositioneilen Befragungsteil nicht die erwartete Verbes- 
serung sichert. Vielmehr wird deutlich, daß mit einer dekompositionellen Befra- 
gung durchaus vergleichbare, teilweise sogar bessere Ergebnisse im Hinblick auf 
die Prognosevalidität erzielt werden können. Dies trifft selbst dann zu, wenn in 
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der Studie eine größere Anzahl von Eigenschaften untersucht werden. Ob auch 
der Self-Explicated-Teil einer hybriden Variante für sich zu vergleichbar guten 
Ergebnissen fuhrt, wird im folgenden Kapitel durch Auswertung der entspre- 
chenden empirischen Vergleiche analysiert. 

2.5.2 Bisherige empirische Vergleiche zwischen hybriden Verfah- 
ren und der Self-Explicated-Methode 

Auch bei Vergleichen zwischen den hybriden Methoden mit der Self-Explicated- 
Methode zeigen sich Parallelen zu den eben diskutierten Befunden. Die Erwar- 
tung, durch die Kombination eines kompositioneilen mit einem dekompositio- 
neilen Befragungsteil bessere Prognoseergebnisse zu erzielen, kann nicht bestä- 
tigt werden (vgl. Tabelle 2-5). Nicht einmal eine individuelle Anpassung des 
Conjoint-Teils fuhrt zu deutlich besseren Untersuchungsergebnissen hinsichtlich 
der Validität. Vielmehr zeigt sich auch hier die Tendenz, daß bereits durch einen 
Teil der Informationen entsprechend gute Prognoseergebnisse erzielt werden 
können. Dieses Argument wird insbesondere dadurch gestärkt, daß nahezu alle 
hier angeführten Vergleiche auf einem „within-subject-design“ basieren. Für den 
Vergleich der Methoden wurden also keine zusätzlichen Daten erhoben, sondern 
bereits nach dem ersten Interviewteil separate Schätzungen der Teilnutzenwerte 
vorgenommen. 



Vgl. hierzu die Ergebnisse von Green/Krieger/Agarwal (1991), Huber et al. (1993) oder 
Pullman/Dodson/Moore (1999). Bei diesen Studien führt die Conjoint-Analyse zu signifi- 
kant besseren Ergebnissen als die ACA, obwohl 8, 9 bzw. 17 Eigenschaften berücksichtigt 
wurden. Pullman/Dodson/Moore (1999) können weiterhin zeigen, daß die Voll-Profil- 
Methode mit allen 17 Eigenschaften einer individualisierten Form, bei der lediglich die in- 
dividuell wichtigsten 8 Eigenschaften bei der Stimulibeschreibung integriert werden, mit 
einer einzigen Ausnahme überlegen ist (vgl. Pullman/Dodson/Moore (1999), S. 131). 
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Vergleicht man das Abschneiden der traditionellen hybriden und der adaptiven 
Varianten gegenüber der Self-Explicated-Methode separat, ergibt sich ein leicht 
differenziertes Bild. Während noch bei 50% (4 von 8) der Vergleiche die tradi- 
tionellen hybriden Verfahren zu besseren Ergebnisse fuhren als die Self- 
Explicated-Methode, trifft dies bei den adaptiven Verfahren in lediglich 18% der 
Gegenüberstellungen zu. Die überwiegende Mehrzahl der Vergleiche zeigt, daß 
die Self-Explicated-Methode zu vergleichbaren, teilweise sogar besseren Ergeb- 
nissen fuhrt als die verschiedenen adaptiven Conjoint-Verfahren. Damit schnei- 
den die traditionellen hybriden Verfahren im Vergleich zur Self-Explicated- 
Methode relativ gesehen besser ab als die adaptiven Verfahren. Dies wirft die 
Frage auf, ob methodische Schwachstellen Gründe für die bisher häufige Unter- 
legenheit der ACA sind. Ob z.B. der Einsatz von Paarvergleichen die entspre- 
chenden Resultate maßgeblich beeinflußt, kann durch Vergleiche zu den anderen 
adaptiven Verfahren nur bedingt analysiert werden. Zwar müssen in der CCA von 
Srinivasan/Park (1997) alle Stimuli simultan bewertet werden, allerdings handelt 
es sich hierbei nicht um eine computergestützte Befragung. Durch die 2-wöchige 
Zeitverzögerung zwischen Self-Explicated- und Conjoint-Teil sind systematische 
Verzerrungen nicht auszuschließen und ein direkter Vergleich nicht zulässig. Ei- 
nen ersten empirischen Vergleich zwischen der CCC und der ACA liefern Hen- 
sel-Bömer/Sattler (2000). Dabei schneidet die CCC (teilweise signifikant) besser 
ab als die ACA.'^® Diese bisher einzige empirische Überprüfung der beiden Vari- 
anten kann jedoch noch keine Antwort auf die Frage geben, ob mit alternativen 
Verfahren zur ACA validere Ergebnisse bei der Prognose von Kaufverhalten er- 
zielt werden können. Vielmehr zeigen auch diese Befunde deutlich, daß bei der 
folgenden empirischen Überprüfung neuer adaptiver Verfahren die Self- 
Explicated-Methode einbezogen werden muß. 

2.6 Zusammenfassung 

Ziel der vorangestellten Ausführungen war, zunächst einen Überblick über ver- 
schiedene Ansätze zur Präferenzmessung zu geben. Dabei wurden alle bisher be- 
kannten Verfahren kurz dargestellt und systematisiert. Grundsätzlich wurden 3 
verschiedene Verfahrensbereiche zur Messung von Präferenzen differenziert. Die 
Self-Explicated-Verfahren als direkte Befragungsmethode und im Gegensatz da- 
zu die dekompositioneilen (indirekten) Verfahren. Bedeutendster Vertreter der 



Vgl. Hensel-Börner/Sattler (2000), S. 13 ff 
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indirekten Verfahren ist die Conjoint-Analyse. Verschiedene Varianten der Con- 
joint- Analyse wurden hinsichtlich der Anzahl simultan zu beurteilender Stimuli 
und der Form der Präferenzabfrage systematisiert. Neben diesen beiden gegen- 
sätzlichen Vorgehensweisen zur Messung von Nachfragerpräferenzen hat sich 
mit den hybriden Ansätzen, einer Mischform aus beiden Verfahren, ein dritter 
großer Verfahrenszweig etabliert. Besondere Bedeutung kommt hierbei der ACA 
als bisher einzig computergestützte adaptive Methode zu. 

Neben der Diskussion der jeweiligen Vor- und Nachteile alternativer Verfahren 
sind die Befunde bisheriger empirischer Vergleiche zusammengefaßt worden. 
Vergleicht man bisherige Forschungsergebnisse zur Reliabilität, vor allem aber 
im Hinblick auf die Validität verschiedener Varianten der rein dekompositionel- 
len Conjoint- Analysen, wird deutlich, daß keiner der bestehenden Formen eine 
grundsätzliche Überlegenheit zugesprochen werden kann. Studien, die Vergleiche 
zwischen den 3 Verfahrenszweigen durchfuhren, können zudem die in der prakti- 
schen Anwendung dominante Rolle der ACA nicht stützen. Daher stellt sich die 
Frage, ob dies mit methodischen Schwächen des Verfahrens zu begründen ist. 
Die ACA als bisher einzig computergestützte hybride Conjoint-Analyse setzt im 
dekompositioneilen Verfahrensteil Paarvergleiche ein. Damit wird lediglich eine 
Variante dekompositionellen Vorgehens im Bereich computergestützter hybrider 
Conjoint- Analysen berücksichtigt, die zudem bei rein dekompositionellen Con- 
joint- Analysen eine eher untergeordnete Rolle spielt.'^' Ziel der vorliegenden 
Arbeit ist daher, den Bereich computergestützter Verfahren um neue Methoden 
zu erweitern, die im Conjoint-Teil entweder alle oder eine Teilmenge der zu be- 
wertenden Stimuli simultan präsentieren. Damit wird der Vielfalt der Gestal- 
tungsformen dekompositioneller Varianten bei computergestützten Conjoint- 
Analysen Rechnung getragen, wobei auch neuere Entwicklungen wie die Choice- 
Based Conjoint Analysis integriert werden. Abbildung 2-6 gibt noch einmal einen 
zusammenfassenden Überblick über alle diskutierten Ansätze zur Präferenzmes- 
sung und verdeutlicht die Einordnung der neu entwickelten Verfahren. 



Vgl. dazu Wittink/Cattin (1989) S. 93 als auch Wittink/Vriens/Burhenne (1994), S. 44. Des 
weiteren wird dies im Rahmen des Literaturüberblicks in Kapitel 2.2.22 deutlich. Tabelle 
2-1 zeigt, daß nur bei 4 der 17 ausgewerteten Studien Paarvergleiche zum Untersuchungs- 
gegenstand zählten. 
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Abbildung 2-6: Überblick über alle diskutierten Ansätze zur Präferenzmessung 
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Quelle: Eigene Erstellung in teilweiser Anlehnung an Green/Srinivasan (1990), S. 9. 



Ein weiteres wichtiges Ergebnis der empirischen Vergleiche betreffen die Befun- 
de für die Self-Explicated-Methode. Auch wenn in einem theoretischen Vergleich 
mit der Conjoint- Analyse zahlreiche Argumente für den Einsatz dieser Methode 
sprechen, zeigt sich diese Überlegenheit in empirischen Studien bisher nicht. 
Weder die rein dekompositioneile Conjoint-Analyse noch hybride Verfahren 
(sowohl traditionelle als auch adaptive) können allein auf Basis ihrer theoreti- 
schen Vorteile der einfacheren Self-Explicated-Methode generell als überlegen 
angesehen werden. Vielmehr schneidet das Self-Explicated-Verfahren vor allem 
im Hinblick auf Prognosevalidität und externer Validität in den vorliegenden 
Untersuchungen empirisch überraschend gut ab. Somit werden bei dem im Rah- 
men dieser Arbeit vorgenommenen empirischen Vergleich neuer adaptiver Me- 
thoden auch die Self-Explicated-Methode berücksichtigt (vgl. Hervorhebung in 
Abbildung 2-6), die unter Anwendungsgesichtspunkten wie Zeit- und Kosten- 
aufwand den umfangreicheren Interviews aller Conjoint- Varianten vorzuziehen 
ist. 
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3 Untersuchte computergestützte hybride Verfahren 

Nachdem in Kapitel 2 ein Überblick über Ansätze zur Präferenzmessung gegeben 
wurde, befaßt sich das folgende Kapitel mit einer ausführlichen Darstellung der 
computergestützten hybriden Verfahren CCC, CHIC und ACA, die im Mittel- 
punkt der vorliegenden Arbeit stehen. Die Einordnung dieser Ansätze wurde be- 
reits im vorangestellten Methodenüberblick vorgenommen. Bei allen 3 unter- 
suchten Methoden handelt es sich um hybride Verfahren, die einen kompositio- 
nellen mit einem dekompositioneilen Befragungsteil verbinden. Des weiteren 
zeichnen sich die Verfahren durch ihren adaptiven Charakter aus, wodurch insbe- 
sondere der dekompositioneile Teil an vorherige Antworten individuell angepaßt 
wird. Voneinander abgegrenzt werden können die Ansätze durch die unter- 
schiedliche Gestaltung dieses individualisierten Conjoint-Teils und das teilweise 
davon beeinflußte Ausmaß der Anpassung. Entsprechend der Strukturierung der 
rein dekompositioneilen Ansätze nach der Anzahl simultan zu beurteilender Sti- 
muli unterscheiden sich auch die CCC, CHIC und die ACA hinsichtlich dieses 
Merkmals. Bei der CCC werden im dekompositioneilen Teil des Interviews alle 
zu bewertenden Stimuli gleichzeitig vorgelegt. In Anlehnung an die Choice- 
Based Conjoint Analysis werden den Probanden bei der CHIC jeweils verschie- 
dene Sets (Teilmengen) von Stimuli präsentiert, aus denen u.a. eine Auswahlent- 
scheidung abgefragt wird. Die ACA basiert im dekompositioneilen Interviewteil 
auf Paarvergleichen, die mit unterschiedlichen Stimuli mehrfach wiederholt wer- 
den. Damit kann jedes dieser drei Verfahren einer anderen Kategorie der dekom- 
positioneilen Ansätze zugeordnet werden. Neben dieser im wesentlichen konzep- 
tionellen Unterscheidung variieren die Verfahren auch in der Gestaltung der ein- 
zelnen Befragungsschritte. Die jeweiligen Besonderheiten der Ansätze werden in 
den folgenden Ausführungen erläutert. 

Während die ACA ein sehr weit verbreiteter Ansatz ist, der sich in der Praxis 
mittlerweile als ein Standardinstrument zur Präferenzmessung etabliert hat, han- 
delt es sich bei der CCC und insbesondere der CHIC um im Rahmen dieser Ar- 
beit neu entwickelte Verfahren. Alle drei Verfahren werden im folgenden aus- 
führlich dargestellt. Die Ausführungen werden dabei entsprechend der einzelnen 
Interviewschritte untergliedert. So werden jeweils zunächst die kompositioneile 
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als auch dekompositioneile Phase beschrieben. Die sich anschließende dritte Pha- 
se ist Grundlage für die Kombination der gewonnenen Informationen. Sowohl die 
Form der Datenerhebung als auch die Schätzung der Teilnutzenfunktionen wer- 
den in jeder Phase dokumentiert. 



Abbildung 3-1 : Interviewablauf der untersuchten computergestützten hybriden 
Verfahren im Vergleich 




Quelle: Eigene Erstellung 



Die Reihenfolge der Darstellung ist an deren Einordnung angesichts der dekom- 
positioneilen Phase angelehnt. Danach wird zunächst die CCC (alle Stimuli si- 
multan), anschließend die CHIC (Teilmenge an Stimuli) und als drittes die ACA 
(zwei Stimuli simultan) dargestellt. 

3.1 Customized Computerized Conjoint Analysis (CCC) 

Grundlage der CCC bildet die von Srinivasan und Park (1997) entwickelte Cu- 
stomized Conjoint Analysis (CCA), bei der sich an die Self-Explicated- 
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Befragung eine Ranking- oder Rating-Aufgabe bezüglich aller zu bewertender 
Produkte anschließt. Das Design der Produktkonzepte wird dabei an die Antwor- 
ten im Rahmen der direkten Befragung angepaßt und für jeden Probanden indivi- 
duell gestaltet. Da die CCC in ihrer Konzeption auf der CCA aufbaut, entspricht 
die folgende Darstellung im wesentlichen den Ausführungen von Srinivasan/Park 
(1997). Die bei der CCC vorgenommenen Modifikationen werden jeweils an ent- 
sprechender Stelle erläutert. 

3.1.1 Self-Explicated-Phase 

3.1. 1.1 Datenerhebung 

Die Self-Explicated-Phase der CCC entspricht der von Srinivasan (1988) vorge- 
stellten Conjunctive-Compensatory Self-Explicated-Methode.’^^ Die Datenerhe- 
bung besteht dabei aus 3 aufeinander folgenden Befragungsschritten. 

1. Schritt: Eliminierung inakzeptabler Eigenschaftsausprägungen 

Der Proband hat die Möglichkeit, für ihn völlig inakzeptable Ausprägungen bei 
den verschiedenen Eigenschaften zu eliminieren.'^^ Diese Ausprägungen werden 
in folgenden Schritten der Befragung nicht mehr berücksichtigt.'^"' 

2. Schritt: Erfassung von Präferenzen zu den Eigenschaftsausprägungen 

Von den verbleibenden Ausprägungen muß der Proband für jede Eigenschaft die 
von ihm am meisten und am wenigsten präferierte Ausprägung identifizieren. 
Diese definieren die Extrempole einer 1 1-Punkte-Ratingskala (Präferenzwert 10 
für die am meisten präferierte Ausprägung und 0 für die am wenigsten präferierte 
Ausprägung). Auf dieser Rating-Skala mit den für den Probanden besten und 
schlechtesten Ausprägung als Ankerpunkte, werden alle weiteren Ausprägungen 
je Eigenschaft eingeordnet. 

Die Bewertung der Eigenschaftsausprägungen (als auch der Eigenschaften im 
nächsten Schritt) erfolgt immer unter der Annahme, daß alle anderen Eigen- 



Vgl. hierzu Kapitel 2.1 dieser Arbeit und Srinivasan (1988), hier: S. 267 f 
Vgl. Srinivasan/Park (1997), S. 287. 

In der derzeitigen Programmversion der CCC ist dieser Schritt noch nicht implementiert. 
Eine optionale Integration dieses Befragungsschritts in einer folgenden Programmversion 
ist geplant. 

Vgl. Srinivasan/Park (1997), S. 287. 
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schäften jeweils konstant sind. Folglich können vor allem bei quantitativen Ei- 
genschaften die beste und schlechteste Ausprägung jeweils a priori festgelegt 
werden. So müßte z.B. bei Konstanz aller anderen Eigenschaftsausprägungen der 
niedrigste Preis am meisten und der höchste Preis am wenigsten von allen Pro- 
banden präferiert werden. Die CCC bietet daher die Möglichkeit, die Abfrage 
nach bester und schlechtester Ausprägung für einzelne Eigenschaften auszu- 
schließen. Die Ankerpunkte der Rating-Skala werden dann bereits vom Marktfor- 
scher fixiert und der Proband muß lediglich die „mittleren“ Ausprägungen ein- 
ordnen. Für dieses Vorgehen sprechen vor allem Überlegungen, die Effizienz der 
Datenerhebung zu erhöhen. Dabei ist Ziel, den Probanden nur mit solchen Fragen 
zu konfrontieren, bei denen, plausibles und konsistentes Verhalten vorausgesetzt, 
keine eindeutige Antwort erwartet werden kann. Auf eine Einordnung der dazwi- 
schen liegenden Ausprägungen wird bewußt nicht verzichtet, um mögliche 
Schwellenwerte oder Sprünge in den Teilnutzenfunktionen erfassen zu können. 

3. Schritt: Abfrage der Wichtigkeiten der Eigenschaften 

Im dritten Schritt der Self-Explicated-Phase werden die Wichtigkeiten der Eigen- 
schaften erfragt. Ausschlaggebend dafür ist die Bedeutung der Verbesserung von 
der am wenigsten zu der am meisten präferierten Ausprägung bei jeder Eigen- 
schaft. Damit wird die Wichtigkeit einer Eigenschaft explizit an die Ausprägun- 
gen in der sie auftritt gekoppelt und das Konzept der Wichtigkeit mit einer kon- 
kreteren Definition verbunden. Gleichzeitig wird dabei die Gefahr des Band- 
breiteneffekts verringert. Um die Wahrscheinlichkeit zu erhöhen, die Wichtig- 
keiten der Eigenschaften tatsächlich auf einer Ratio-Skala zu erfassen, wird zu- 
nächst die für den Probanden insgesamt wichtigste Eigenschaft definiert. Hier- 
für wird erfragt, bei welcher Eigenschaft die Verbesserung von der am wenigsten 
zu der meistpräferierten Ausprägung am wertvollsten ist. Dieser Eigenschaft wird 



Ausnahmen können hierbei auftreten, sofern der Preis als Qualitätsindikator dient und der 
Informationspreiseffekt größer als der Allokationspreiseffekt ist. Ein solches Verhalten der 
Probanden würde sich in einer höheren Präferenz für einen höheren Preis widerspiegeln. 
Zur Separierung der Allokations- und Informationsfunktion des Preises vgl. Sattler/Rao 
(1997), hier; S. 1287. 

Häufig wird die Wichtigkeit einer Eigenschaft in die Frage: „Wie wichtig ist Ihnen die 
Eigenschaft X?“ erhoben. Bei einem solchen Vorgehen ist oft nicht eindeutig, wie das 
Konzept der Wichtigkeit zu interpretieren ist und birgt die Gefahr, daß Probanden diese 
Frage unterschiedlich interpretieren (vgl. Srinivasan (1988), S. 296). 

Zur Problematik des Bandbreiteneffekts vgl. Sattler/Gedenk/Hensel-Börner (2000). 

Vgl. Srinivasan (1988), S. 296. 
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der Wert 10 zugeordnet und dient für die Beurteilung der anderen Eigenschaften 
als Ankerpunkt („critical attribute“). Die Wichtigkeit aller weiteren Eigenschaf- 
ten ist daraufhin durch die Auskunftspersonen auf einer Rating-Skala 0 bis 10 zu 
beurteilen. Diese Skala ist einseitig mit der für den Probanden als am wichtigsten 
beurteilten Eigenschaft bei dem Wert 10 verankert. Je höher der Wert, den der 
Proband einer Eigenschaft zuordnet, desto wichtiger ist sie für ihn.^^^ 

3.1. 1.2 Schätzung der Teilnutzenwerte 

Entsprechend dem multiattributiven Präferenzmodell werden auf Basis der Be- 
fragungsschritte 1 bis 3 die Self-Explicated-Teilnutzenwerte für alle J Eigen- 
schaften berechnet. Zur Vereinfachung erfolgt zunächst eine Umskalierung der 
Wichtigkeiten in der Form, daß deren Summe 100 ergibt. Der Vorteil dieser 
Umskalierung liegt darin, daß die Spannbreite der ermittelten Teilnutzenwerte je 
Eigenschaft direkt als relatives Bedeutungsgewicht interpretiert werden kann. Die 
Self-Explicated-Teilnutzenwerte für jede Eigenschaftsausprägung erhält man 
durch Multiplikation der umskalierten Wichtigkeiten der Eigenschaften mit dem 
normierten Präferenzwert der Ausprägung: 

(3-1) Pifif = G|j(Dy|, / lo) (ieI;j€J;k£Kj) 

wobei: 

pSE ; Self-Explicated (SE) Teilnutzen der k-ten Ausprägung bei 
der j-ten Eigenschaft für den i-ten Probanden, 

Gijl Umskalierte Wichtigkeit der j-ten Eigenschaft beim i-ten 
Probanden, 

Dijki Präferenzwert der k-ten Ausprägung bei der j-ten Eigen- 
schaft beim i-ten Probanden, 

Kj: Indexmenge der Eigenschaftsausprägungen der j-ten Eigen- 

schaft, 

J : Indexmenge der Eigenschaften, 

I: Indexmenge der Probanden. 



Vgl. Srinivasan/Park (1997), S. 287. 
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Nach Berechnung der Teilnutzenwerte werden diese so normiert, daß ihre Sum- 
me über alle Ausprägungen je Eigenschaft 0 beträgt. 

Von allen bewerteten J Eigenschaften werden die aus Sicht des i-ten Probanden 
Cj (Ci€J) wichtigsten Eigenschaften ausgewählt. Dies sind die sog. Kerneigen- 
schaften, die in der anschließenden Conjoint- Aufgabe berücksichtigt werden. 
Durch die individuell verschiedenen Wichtigkeiten der Eigenschaften variieren 
die im Conjoint-Interview verwendeten Kerneigenschaften von Proband zu Pro- 
band. Diese individuelle Anpassung der Kerneigenschaft an die Antworten der 
Self-Explicated-Phase bestimmt den adaptiven Charakter der Methode und hat 
zur Bezeichnung Customized Conjoint Analysis geführt. Da alle zu bewer- 
tenden Stimuli im dekompositioneilen Befragungsteil simultan präsentiert wer- 
den, ist eine Anpassung der Stimulikonstruktion an vorangegangene Antworten 
der Auskunftsperson lediglich einmalig möglich. Aus dieser Konzeption des 
Conjoint-Interviews ergibt sich folglich ein geringeres Maß an Adaption als bei- 
spielsweise bei der ACA. 

Die Auswahl der Kerneigenschaften und die individuelle Anpassung der Con- 
joint-Phase erfolgt bei der CCA in einem zweiten Interview. Da es sich bei der 
CCA um eine schriftliche Befragung handelt, kann zwischen diesen beiden Inter- 
viewphasen eine erhebliche Zeitverzögerung entstehen (in einer empirischen Stu- 
die von Srinivasan/Park (1997) waren es zwei Wochen). Als Folge davon ist 
u.a. mit erhöhtem Erhebungsaufwand und einem Ausfall von Versuchspersonen 
zu rechnen. Gleichzeitig besteht die Möglichkeit, daß sich die Präferenzen der 
Probanden über die Zeit verändert haben und die Validität der Ergebnisse da- 
durch eingeschränkt wird. Um diesen wesentlichen Nachteil der CCA zu über- 
winden, basiert die Customized Computerized Conjoint Analysis (CCC) auf 
einem vollständig computergestützten Interview, bei dem eine unmittelbare An- 
passung des Conjoint-Teils an die Antworten des Self-Explicated-Teils erfolgt. 
Alle notwendigen Daten werden dabei innerhalb eines Interviews mit dem Pro- 
banden erhoben. 



Vgl. Srinivasan/Park (1997), S. 287. 
Vgl. Srinivasan/Park (1997), S. 286. 
Vgl. Srinivasan/Park (1997), S. 288. 
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3.1.2 Conjoint-Phase 

In Anlehnung an die Systematisierung dekompositioneller Ansätze in Kapitel 2 
wird die Conjoint-Phase der computergestützten hybriden Verfahren unterglie- 
dert. Ein erstes Kennzeichen ist wie bereits ei^vähnt die Anzahl simultan zu be- 
urteilender Stimuli. Teilweise in Abhängigkeit davon, ergeben sich die Gestal- 
tungsmöglichkeiten für die Abfrage der Präferenz bzw. Form der Beurteilungs- 
aufgabe. Als dritter Unterpunkt wird jeweils angeführt, wie auf Basis der erhobe- 
nen Präferenzdaten die Conjoint-Teilnutzenwerte geschätzt werden. 

3.1.2.1 Anzahl simultan zu bewertender Stimuli 

Die Anzahl der Stimuli, die den Probanden zur Bewertung vorgelegt werden, 
wird durch die beschreibenden Eigenschaften und deren Ausprägungen determi- 
niert. Zur Beschreibung der Stimuli werden die in der Self-Explicated-Phase 
identifizierten Kerneigenschaften herangezogen. Um die Probanden kognitiv 
nicht zu überfordern, sollten nicht mehr als 6 Eigenschaften als Kerneigenschaf- 
ten zugelassen werden. Zudem wird die Zahl der Ausprägungen je Kemeigen- 
schaft auf (maximal) 3 begrenzt. Der Vorteil dieser Reduzierung besteht darin, 
daß damit für alle Eigenschaften nahezu gleich viele Ausprägungen betrachtet 
werden und Verzerrungen aufgrund des sog. Number-of-Level-Effekts^^^ vermie- 
den werden können. Falls eine Kerneigenschaft mehr als 3 Ausprägungen auf- 
weist, wird jeweils eine Auswahl nach dem gleichen Grundprinzip vorgenom- 
men. Mit der am wenigsten und am meisten präferierten Ausprägung wird zu- 
nächst die Bandbreite einer Eigenschaft definiert. Als dritte Ausprägung wird 
eine mittlere, die einen Wert nahe 5 auf der 1 1-Punkte-Rating-Skala erhalten hat, 
ausgewählt. 



Vgl. hierzu auch die Diskussion zur Anzahl an Eigenschaften bei dekompositioneilen An- 
sätzen zur Präferenzmessung in Kapitel 2.3.1. 

Der Number-of-Level-Effekt besagt, daß je mehr Ausprägungen bei einer Eigenschaft be- 
rücksichtigt werden, desto höher wird deren Bedeutungsgewicht. Empirische Belege dafür 
liefern u.a. Wittink/Krishnamurthi/Nutter (1982) und Wittink/Krishnamurthi/Reibstein 
(1989). Steenkamp/Wittink (1994) zeigen des weiteren, daß der Number-of-Level-Effekt 
auch unabhängig vom Skalenniveau der Beurteilungsaufgabe auftritt. 

Vgl. Srinivasan/Park (1997), S. 287. 

Falls eine Eigenschaft mit lediglich 2 Ausprägungen auftritt, werden diese beiden im Rah- 
men der Stimulikonstruktion berücksichtigt. 
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Obwohl dadurch die Anzahl an Eigenschaften und deren Ausprägungen für die 
Conjoint-Phase des Interviews begrenzt werden, ist eine Bewertung aller mögli- 
chen Eigenschaftskombinationen nicht möglich. Bei nur 4 Kerneigenschaften mit 
jeweils 3 Ausprägungen müßten den Probanden bereits 81 Produktkonzepte vor- 
gelegt werden. Das simultan zu bewertende Stimuli-Set wird daher mittels eines 
fraktionierten faktoriellen Designs erstellt, wodurch das vollständige Design 
möglichst gut repräsentiert wird.'^^ Zielkriterium in diesem Fall ist das Prinzip 
der Orthogonalität'^^, bei dem die Eigenschaften und deren Ausprägungen unkor- 
reliert sind.'^'' Da sowohl die Kerneigenschaften als auch deren Ausprägungen 
über die Probanden variieren, unterscheiden sich die Designpläne zwischen den 
Probanden. Die damit verbundene Individualisierung der Stimuli bestimmt maß- 
geblich den adaptiven Charakter der CCC.'^' Durch die individualisierten Stimuli 
werden gleichzeitig systematische Einflüsse auf die Ergebnisse durch die Stimu- 
libeschreibung, wie z.B. die Reihenfolge, in der die Eigenschaften aufgefuhrt 
sind, vermieden. 

Als letzte Einflußgröße auf die Anzahl zu bewertender Stimuli ist die Menge zu 
schätzender Parameter zu berücksichtigen. Je nach Anzahl an Eigenschaften und 
angenommener Funktionsverläufe für die Teilnutzenfunktionen sind unterschied- 
lich viele Parameter zu schätzen. Die Wahl der Funktions Verläufe wird maßgeb- 
lich von der Art der Eigenschaften determiniert. Für qualitative bzw. kategoriale 
Eigenschaften wie z.B. „Marke“ wird üblicherweise ein Teilnutzenmodell ange- 
nommen, bei dem für jede Ausprägung ein separater Teilnutzenwert zu schätzen 
ist.'^^ Im Gegensatz dazu kann bei quantitativen Eigenschaften ein Vektormodell 
und damit ein linearer Zusammenhang zwischen den Eigenschaftsausprägungen 
unterstellt werden. In diesem Fall ist die Schätzung eines Parameterwertes ausrei- 



Zu den Problemen bei einem vollständigen Design vgl. auch Kapitel 2.2. 1.1. 

Zum Begriff der Orthogonalität und seiner formalen Definition vgl. Stallmeier (1993), S. 
144. 

Zur Entwicklung von fraktionierten faktoriellen Designs vgl. Addelman (1962). 

Vgl. Srinivasan/Park (1997), S. 287. Die Autoren sprechen in diesem Zusammenhang nicht 
von einem adaptiven, sondern einem „customized“ Design. Zur Begriffsabgrenzung im 
Rahmen dieser Arbeit vgl. Kapitel 2.4. 

Dieser Einflußfaktor auf die Ergebnisse einer Conjoint-Analyse wird in der Literatur als 
„Positionseffekt“ bzw. „order effects“ bezeichnet. Empirische Belege fiir deren Einfluß lie- 
fern z.B. Acito (1977), S. 205; Chrzan (1994), S. 169 f und Perry (1996), S. 1 1 1. 

Vgl. Green/Srinivasan (1978), S. 106. 
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chend.'^'^ Insgesamt muß bei der Entscheidung über die Anzahl zu erhebender 
Datenpunkte bei der CCC aber gleichzeitig sichergestellt werden, daß alle Stimuli 
simultan auf dem Bildschirm darstellbar sind. 

3.1.2.2 Form der Beurteilungsaufgabe 

Ein wesentliches Kennzeichen der CCC liegt darin, daß die Probanden alle Sti- 
muli der Conjoint-Phase simultan zu bewerten haben. Die Präferenzen können 
dabei entweder in Form einer Rangreihung oder mit Hilfe einer Rating-Skala er- 
hoben werden. Bei der CCC werden diese beiden Beurteilungsaufgaben mit- 
einander kombiniert. Die Auskunftsperson wird zunächst gebeten, die Stimuli in 
eine Präferenzrangfolge zu bringen. Zusätzlich wird im Anschluß daran für jeden 
Rangplatz die Kaufwahrscheinlichkeit auf einer Skala von 0 bis 100% erfragt. 
Zur Erleichterung dieser Aufgabe und um inkonsistente Antworten zu vermeiden, 
werden die Produkte vor dieser Abfrage gemäß der von den Probanden angege- 
benen Präferenzrangfolge sortiert. Mit der Kombination dieser beiden Beurtei- 
lungsaufgaben werden die Vorteile der jeweiligen Vorgehensweise miteinander 
verknüpft. Während die Angabe einer Präferenzrangfolge einen echten Trade-Off 
zwischen verschiedenen Eigenschaften fordert, werden über die Kaufwahr- 
scheinlichkeiten die Präferenzunterschiede zwischen den Stimuli quantifiziert. 
Gleichzeitig kann damit erfaßt werden, ob überhaupt eine Kaufwahrscheinlich- 
keit für die jeweiligen Produktkonzepte vorliegt. Gleichzeitig werden somit über 
die Präferenzdaten hinaus auch Infonnationen hinsichtlich des Entscheidungsver- 
haltens der Probanden erhoben. Eine solche Kombination der beiden Beurtei- 
lungsaufgaben schlagen beispielsweise auch Green/Krieger (1996) vor.'^^ Zwei- 
felsohne wird dadurch der Erhebungsaufwand insgesamt erhöht. Ein empirischer 
Vergleich der Ergebnisse jeweils auf Basis der einzelnen Bewertungsschritte se- 
parat, kann zeigen, ob dieser zusätzliche Erhebungsaufwand durch validere Er- 
gebnisse gerechtfertigt ist. 



Zu den unterschiedlichen Teilnutzenmodellen vgl. Green/Srinivasan (1978), S. 105 f. 
Srinivasan/Park (1997) sprechen bei der Beschreibung der CCA davon, daß grundsätzlich 
Ranking- oder Rating-Daten erhoben werden können (S. 287). In der empirischen Untersu- 
chung wurden die Präferenzen durch Rangreihung der Stimuli erfragt. 

Vgl. hierzu auch Hahn (1997), der als wesentlichen Kritikpunkt an der traditionellen Con- 
joint-Analyse mit Rangreihung anführt, daß lediglich Präferenzen und keine Kaufentschei- 
dungsdaten erhoben werden (Hahn (1997), hier: S. 41). 

Vgl. Green/Krieger (1996), S. 853. 
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3.1.2.3 Schätzung der Teilnutzenwerte 

Auf Basis der erhobenen Präferenzen werden flir alle Kerneigenschaften Teilnut- 
zenwerte bestimmt. Je nach Skalenniveau der abhängigen Variable (also der 
Form der Beurteilungsaufgabe) werden die Teilnutzenwerte der Conjoint-Phase 
mit Hilfe unterschiedlicher Schätzverfahren ermittelt. Sofern die Stimuli auf me- 
trischem Skalenniveau (Rating-Skala) beurteilt werden, wird eine OLS- 
Schätzung (Ordinary Least Squares) zur Ermittlung der Teil nutzen werte durchge- 
fiihrt. Im Falle einer Präferenzabfrage in Form von Rangreihung, muß streng ge- 
nommen auch ein nicht-metrisches Verfahren eingesetzt werden. In der vorlie- 
genden Untersuchung wurde das Verfahren LINMAP (Linear Programming 
Techniques for Multidimensional Analysis of Preferences)'^^ angewendet, das auf 
Basis einer linearen Optimierung die Teilnutzen werte bei ordinal skalierten Prä- 
ferenzwerten ermittelt.’^^ Um die ermittelten Conjoint-Teilnutzen der Kerneigen- 
schaften mit denen aus der Self-Explicated-Phase vergleichen zu können, werden 
diese in zweierlei Hinsicht umskaliert. Zum einen werden die Teilnutzenwerte so 
normiert, daß die Summe innerhalb jeder Kerneigenschaft Null ergibt und zum 
anderen so umskaliert, daß die Summe der Conjoint-Bedeutungsgewichte der 
Kemeigenschaften gleich der Summe der Self-Explicated-Bedeutungsgewichte 
der Kerneigenschaften ist. 

3.1.3 Kombinationsphase 

Neben den Self-Explicated-Teilnutzenwerten für alle untersuchten Eigenschaften 
liegen zusätzlich umskalierte Conjoint-Teilnutzen werte für die jeweiligen Kern- 
eigenschaften eines Probanden vor. Die Informationen bezüglich der Kerneigen- 
schaften werden folglich mit zwei unterschiedlichen Methoden erhoben. Die 
Grundidee der CCC ist, die Informationen über die Kemeigenschaften aus beiden 



Zur ausführlichen Erläuterung des Algorithmus vgl. Srinivasan/Shocker ( 1 973). 

Obwohl Ranking-Daten nicht das notwendige Skalenniveau aufweisen, werden die Teil- 
nutzenwerte häufig auch mit Hilfe einer OLS-Schätzung ermittelt, wobei die Präferenzda- 
ten als metrisch interpretiert werden. Voran gegangene Studien haben gezeigt, daß zwi- 
schen metrischen und nicht-metrischen Präferenzdaten bei der Anwendung von Conjoint- 
Analysen in Form von OLS-Schätzungen keine wesentlichen Unterschiede auftreten bzw. 
robuste Schätzergebnisse erzielt werden (vgl. Green/Srinivasan (1978); Carmo- 
ne/Green/Jain (1978); Jain/Acito/Malhotra/Mahajan (1979) Wittink/Cattin (1981)). Der 
Einsatz einer OLS-Schätzung zur Auswertung von Präferenzdaten, die in Form von Rang- 
reihung erhoben wurden, kann daher als zulässig angesehen werden. Dieses Vorgehen hat 
den Vorteil, daß OLS-Schätzungen mittels üblichen Softwareprogrammen wie z.B. SPSS 
oder Excel durchgefiihrt werden können. 
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Phasen optimal zu kombinieren, um die tatsächlichen Präferenzstrukturen der 
Probanden bestmöglich abzubilden. Grundlage hierfür ist ein sog. Validation-Set. 
Dieses beschreibt die verschiedenen Produktkonzepte ebenfalls durch die indivi- 
duellen Kerneigenschaften, unterscheidet sich aber in der Zusammensetzung der 
verschiedenen Eigenschaftsausprägungen von denen der Conjoint-Phase, so daß 
die Produktprofile so weit wie möglich von den bereits beurteilten abweichen. 
Auch für das Validation-Set, das aus weniger Stimuli bestehen kann als die ei- 
gentliche Conjoint- Aufgabe, werden von jedem Probanden Präferenzen erfragt.^^® 
Die Form der Präferenzabfrage entspricht dabei dem Vorgehen in der Conjoint- 
Phase. 

Die Self-Explicated- und Conjoint-Teilnutzenwerte werden in der Form kombi- 
niert, daß die auf Basis der kombinierten Teilnutzenwerte prognostizierten Präfe- 
renzen für das Validation-Set möglichst gut mit den tatsächlich beobachteten 
übereinstimmen. Um diese optimale Kombination zu bestimmen, wird zunächst 
eine Gewichtung der beiden Teilnutzen werte für die Kernattribute vorgenommen. 
Für die gewichteten Teilnutzen werte gilt: 

(3-2) Pj]; = w + (1 - w i )Pjf|f (iel; j€Q; ke Kj) 

wobei: 

pW Gewichteter Teilnutzen der k-ten Ausprägung bei der j-ten 
Kerneigenschaft für den i-ten Probanden, 

Wj : Gewichtungsfaktor beim i-ten Probanden, wobei (0<Wi<l), 

pCA Umskalierter Conjoint-Teilnutzen der k-ten Ausprägung bei 
Uk • der j-ten Kerneigenschaft für den i-ten Probanden, 

p S E Self-Explicated-Teilnutzen der k-ten Ausprägung bei 
‘jk ‘ der j-ten Kerneigenschaft für den i-ten Probanden, 

Ci : Indexmenge der Kernattribute beim i-ten Probanden. 

Für alternative Gewichte Wj (Wj == 0; 0,01; 0,02; ...;1) wird jeweils die Überein- 
stimmung zwischen prognostizierten und tatsächlichen Präferenzen für das Vali- 



Srinivasan/Park (1997) schlagen beispielsweise 6 Stimuli für das Validation-Set vor (hier: 
S. 288). 
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dation-Set berechnet. Die optimale Gewichtung ist für den Wert Wj erreicht, bei 
dem sich die höchste Übereinstimmung ergibt. Gemessen wird diese je nach 
Skalenniveau der erhobenen Präferenzwerte durch den Korrelationskoeffizient 
nach Pearson oder Kendall.’^‘ 

Wenn die optimale Gewichtung Wj* für einen Probanden ermittelt wurde, kann 
seine Präferenz für einen neuen Stimulus prognostiziert werden. Hierfür werden 
unter Annahme eines additiven Nutzenmodells die optimal gewichteten Teilnut- 
zenwerte (aus Conjoint- und Self-Explicated-Phase) für die Ausprägungen der 
Kerneigenschaften und die Self-Explicated-Teilnutzenwerte für die Ausprägun- 
gen der Nicht-Kerneigenschaften addiert. Uj ist dann die prognostizierte Präfe- 
renz, gemessen durch den prognostizierten Gesamtnutzenwert, des i-ten Proban- 
den für ein Produkt 



+ 1- w 



*\pSE 1. 



(iGl;keKj) 



wobei: 

Uj : Gesamtnutzenwert eines Produkts für den i-ten Probanden, 

. Optimaler Gewichtungsfaktor zwischen Conjoint-Teilnutzen 
‘ und Self-Explicated-Teilnutzen bei den Kernattributen für 
den i-ten Probanden, 

NCii Indexmenge der Nicht-Kernattribute beim i-ten Probanden. 

Hinsichtlich dieser Berechnung der Gesamtnutzenwerte nimmt die CCC eine 
weitere Modifikation gegenüber der CCA vor. Die Motivation für die vorge- 
nommene Erweiterung besteht in folgender Überlegung: In Gleichung (3-3) ge- 
hen die Nicht-Kemeigenschaften mit ihrem vollen Self-Explicated-Gewicht (Ge- 
wichtungsfaktor I) in die prognostizierte Präferenz eines neuen Produkts ein, 
wohingegen die Kemeigenschaften mit der optimalen Gewichtung von Conjoint- 
und Self-Explicated-Gewichten berücksichtigt werden. Dadurch kann der Fall 



Vgl. Srinivasan/Park (1997), S. 288. 

Aus Gründen der Übersichtlichkeit wird in Gleichung (3-3) kein zusätzlicher Index für das 
Produkt integriert. 
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auftreten, daß ein oder mehrere Bedeutungsgewichte von Kerneigenschaften nach 
der optimalen Gewichtung (z.T. wesentlich) kleiner sind als die Bedeutungsge- 
wichte von Nicht-Kemeigenschaften. Dies ergibt sich insbesondere dann, wenn 
einzelne Kerneigenschaften im Conjoint-Teil der Befragung als relativ unwichtig 
eingestuft werden und sich für die kombinierten Teilnutzen werte ein relativ ho- 
hes Gewicht für die Conjoint-Teilnutzen insgesamt ergibt. Um diesem Effekt 
entgegenzuwirken, wird Gleichung (3-3) so modifiziert, daß auch die Nicht- 
Kemeigenschaften mit dem optimalen Gewicht (1-Wj*) multipliziert werden: 

(3-4) u, = + (i - 1 + z(i - »:)PiE k.K,) 

jeCi ■' jeNC- 

Mit dieser veränderten Berechnung der Gesamtnutzenwerte liegt die Wahr- 
scheinlichkeit, daß die Bedeutungsgewichte jeder einzelnen Kerneigenschaft grö- 
ßer sind als die der Nicht-Kerneigenschaften wesentlich höher als bei der CCA. 
So zeigte sich in einer ersten empirischen Anwendung der CCC für Kaffeesorten, 
die als Pretest für die vorliegende Studie diente, daß unter Verwendung von Glei- 
chung (3-4) zur Berechnung der Gesamtnutzenwerte für 75% der Probanden die 
Kerneigenschaften Jeweils nicht unwichtiger waren als die wichtigste Nicht- 
Kemeigenschaft.'^^ Ein Vergleich der Ergebnisse auf Basis Gleichung (3-3) ge- 
mäß CCA zeigte, daß bei alter Berechnungsformel der entsprechende Prozentsatz 
nur 14% betrug. Umgekehrt bedeutet dies, daß für 86% der Auskunftspersonen 
Nicht-Kemeigenschaften mindestens hinsichtlich einer Eigenschaft (teilweise um 
ein Vielfaches) wichtiger waren als eine oder mehrere Kemeigenschaften. Die 
gewählte Modifikation in Gleichung (3-4) stellt dabei nicht sicher, daß mit 100% 
Wahrscheinlichkeit das Bedeutungsgewicht jeder einzelnen Kerneigenschaft grö- 
ßer ist als das der wichtigsten Nicht-Kerneigenschaft. Darauf wurde bewußt ver- 
zichtet, denn eine solche Modellierung der Gesamtnutzenwerte würde implizie- 
ren, daß die Unterscheidung von Kern- und Nicht-Kemeigenschaften durch das 
Self-Explicated-Verfahren verzerrungsfrei gelingt. Davon kann jedoch vor allem 
in Situationen bei nur geringen Unterschieden zwischen den Self-Explicated- 
Bedeutungsgewichten für die Kern- und Nicht-Kemeigenschaften nicht ausge- 
gangen werden. Welche der beiden Berechnungsformeln die tatsächlichen Präfe- 

Vgl. Hensel-Börner/Sattler (2000), S. 9. 



81 




renzen der Probanden eher abbildet, hängt maßgeblich von der Verteilung der 
Bedeutungsgewichte der Probanden ab und kann somit nur empirisch überprüft 
werden. 

Um den Effekt der neuen Berechnungsformel im Vergleich zur von Sriniva- 
san/Park (1997) vorgeschlagenen Berechnung der Gesamtnutzenwerte quantifi- 
zieren zu können, werden in der folgenden empirischen Untersuchung beide Va- 
rianten angewendet und verglichen. Zur Unterscheidung wird in diesem Zusam- 
menhang bei Verwendung von Gleichung (3-3) von der CCC-alt und von der 
CCC-neu bei Berechnung der Gesamtnutzenwerte gemäß Gleichung (3-4) ge- 
sprochen. Zusammenfassend sei an dieser Stelle festgehalten, daß die CCC in 
ihrer Grundstruktur auf der Idee der CCA basiert, wobei zwei wesentliche Modi- 
fikationen zum Tragen kommen. Zum einen basiert die CCC auf einem compu- 
tergestützten Interview, bei dem alle Daten im Rahmen eines Interviews mit der 
Auskunftsperson erhoben werden. Zum anderen wird vor dem Hintergrund der 
angeführten Überlegungen mit der CCC eine alternative Berechnungs Vorschrift 
zur Ermittlung der Gesamtnutzenwerte vorgeschlagen. Diese zweite Modifikation 
wirkt sich nicht auf die Datenerhebung aus, so daß für einen vorliegenden Daten- 
satz jeweils überprüft werden kann, welche Berechnungsformel für die Abbil- 
dung der Präferenzstrukturen am besten geeignet ist. Der Interviewablauf der 
CCC wird in folgender Abbildung 3-1 noch einmal im Überblick zusammenge- 
faßt. 
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Abbildung 3-2: Interviewablauf der CCC 



Phase 


Befragungsschritt 


Vorgehensweise bei der CCC 




1 . Schritt: 


• Direkte Frage nach inakzeptablen Eigen- 




Eliminierung inakzeptabler Eigen- 


Schaftsausprägungen 




Schaftsausprägungen 


(in der derzeitigen Programmversion noch 
nicht implementiert) 




2. Schritt: 


• Frage nach der am wenigsten (0 Punkte) und 




Erfassung von Präferenzen gegen- 


der am meisten präferierten (10 Punkte) 
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PL| 


über Eigenschaftsausprägungen 


Ausprägung je Eigenschaft 


-o 




•Vergabe eines Punktwertes von 0 bis 10 für 






dazwischenliegende Ausprägungen 


"E- 


3. Schritt: 


• Frage nach der wichtigsten Eigenschaft (10 




Erfassung der Wichtigkeiten 


Punkte) 


C/) 




•Vergabe eines Punktwerts von 0 bis 10 
Punkte für die übrigen Eigenschaften unter 
Verwendung der wichtigsten Eigenschaft als 
Ankergröße 




Schätzung der Teilnutzenwerte führt zur SE-CCC 




und Identifikation der Kerneigenschaften 
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Erfassung ganzheitlicher 


• Angabe einer Präferenzrangfolge für 8 bis 16 


•S ^ 


Präferenzen 


Produkte, die durch 3 bis 6 Kerneigenschaf- 


fl ^ 




ten beschrieben werden 


O Oh 
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• Angabe einer Kaufwahrscheinlichkeit zwi- 
schen 0% und 100% für jeden Rangplatz 




Kombination der Informationen aus 


• Angabe einer Präferenzrangfolge für ein 


w 

OS 


den beiden vorangegangenen Be- 


Validation-Set, das aus 3 bis 12 Produkten 


M 

CU 


fragungsteilen 


besteht. Ebenfalls beschrieben durch 3 bis 6 


CA 

a 




Kerneigenschaften 


E 




•Angabe einer Kaufwahrscheinlichkeit von 


fl 

IS 




0% bis 100% für jeden Rangplatz 


B 

£ 


Ermittlung der kombinierten Gesamtnutzenwerte gemäß 




Gleichung (3-3) bzw. (3-4) führt zur CCC-alt und CCC-neu 



Quelle: Eigene Erstellung 



3.2 Choice-Oriented Individualized Conjoint Analysis 
(CHIC) 

Die CHIC- Variante stellt ebenfalls ein computergestütztes hybrides Verfahren 
dar, das analog zur CCC einen individualisierten Interviewablauf aufweist. Auf 
Basis des kompositioneilen Befragungsteils werden die individuell wichtigsten 



Die alternative Bezeichnung „individualized“ gegenüber „customized“ bei der CCC wurde 
lediglich vor dem Hintergrund der kreierten Abkürzung CHIC gewählt. 
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Eigenschaften als Kemeigenschaften identifiziert und in der folgenden Conjoint- 
Phase berücksichtigt. Der wesentliche Unterschied im Vergleich zur CCC liegt in 
der Zahl simultan zu bewertender Stimuli und darauf aufbauend in der Gestaltung 
der Beurteilungsaufgabe des dekompositionellen Interviewteils. In Anlehnung an 
die Choice-Based Conjoint Analysis werden den Probanden einzelne Choice-Sets 
(also Teilmengen an Stimuli) präsentiert und zunächst eine Auswahlentscheidung 
zur Beurteilung der Stimuli abverlangt. Darüber hinaus wird die Präferenzabfrage 
erweitert, um auch auf Basis der dekompositionellen Phase individuelle Teilnut- 
zenfunktionen für jeden Probanden separat schätzen zu können. Bei der folgen- 
den Darstellung der CHIC werden die Unterschiede gegenüber der CCC ausführ- 
lich erläutert, wogegen identische Ablaufschritte nicht noch einmal explizit be- 
schrieben werden. 

3.2.1 Self-Explicated-Phase 

Der Self-Explicated-Teil der CHIC entspricht dem Vorgehen der CCC. Auf eine 
erneute Darstellung wird daher an dieser Stelle verzichtet und auf die Ausführun- 
gen in Kapitel 3.1.1 verwiesen. 

3.2.2 Conjoint-Phase 

Die dekompositioneile Phase der CHIC unterscheidet sich maßgeblich von der 
CCC sowohl hinsichtlich der Anzahl simultan zu bewertender Stimuli als auch 
des Ablaufs und Form der Präferenzabfrage. Die Konzeption der Conjoint-Phase 
bei der CHIC wird im folgenden vor dem Hintergrund dieser beiden Unterschei- 
dungsmerkmale ausführlich dargestellt. 

3.2.2.1 Anzahl simultan zu beurteilender Stimuli 

Beschrieben werden die Stimuli der dekompositionellen Phase wie bei der CCC 
durch die auf Basis der Self-Explicated-Phase identifizierten Kerneigenschaf- 
ten.'^^ In dieser Anpassung liegt der Kern der Individualisierung des Verfahrens, 
denn je nach erhobener Wichtigkeit der Eigenschaften variieren die berücksich- 
tigten Eigenschaften in der Conjoint-Phase über die verschiedenen Probanden. 
Während allerdings bei der CCC den Auskunftspersonen jeweils alle zu bewer- 
tenden Stimuli gleichzeitig präsentiert werden, sind diese bei der CHIC in Anleh- 



Auch hier werden wieder max. 3 Ausprägungen je Eigenschaft berücksichtigt, wobei die 
für jeden Probanden beste und schlechteste sowie eine mittlere Ausprägung ausgewählt 
werden. 
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nung an die Choice-Based Conjoint Analysis auf einzelne Choice-Sets aufgeteilt. 
Ein solches Choice-Set besteht aus einer Teilmenge der zu bewertenden Stimuli 
und wird jeweils unabhängig von den anderen Sets bewertet. Damit umfaßt die 
Entscheidung hinsichtlich der Anzahl zu bewertender Stimuli bei der CHIC zwei 
Fragestellungen. Zum einen muß die Zahl der insgesamt zu bewertenden Stimuli 
festgelegt werden und zum anderen gilt es, diese bestmöglich auf die verschiede- 
nen Choice-Sets aufzuteilen. 

Auswahl der insgesamt zu beurteilenden Stimuli 

Obwohl bei der CHIC jeweils nur Teilmengen aller Stimuli simultan zu bewerten 
sind, können nur bei einer sehr begrenzten Anzahl an Kerneigenschaften insge- 
samt alle Stimuli (d.h. das vollständige Design) zur Beurteilung vorgelegt wer- 
den, um die Auskunftspersonen nicht zu überfordern. Daher muß wie bei der 
CCC ein reduziertes „Gesamtdesign“ erstellt werden. Diese Reduzierung der 
Stimuli erfolgt bei der CCC gemäß eines fraktionierten faktoriellen Designs. Bei 
der CHIC dagegen wird hierfür eine Zufallsauswahl an Stimuli aus dem jeweils 
vollständigen Design ausgewählt. Zwar sind zufällig erstellte bzw. randomisierte 
Designs in den seltensten Fällen orthogonal und büßen damit ein gewisses Maß 
an Effizienz’ ein, sie ermöglichen jedoch die Schätzung von Interaktionseffek- 
ten. Wie viele Stimuli insgesamt ausgewählt werden und zu bewerten sind, 
hängt wiederum von der Anzahl an Kerneigenschaften und den daraus resultie- 
renden Schätzparametern ab. 

Über eine zufällige Auswahl hinaus wird die Reduzierung der Stimuli an dem 
Prinzip der Pareto-Optimalität orientiert. Ein pareto-optimales Design ist dadurch 
gekennzeichnet, daß keine Alternative alle anderen dominiert. Die Pareto- 
Optimalität wird dabei im Sinne von Krieger/Green (1991) definiert. Entspre- 
chend dieser Definition dominiert eine Alternative eine andere, sofern sie in we- 
nigstens einer Eigenschaftsausprägung eindeutig präferiert wird, während alle 



Das Gesamtdesign bezieht sich auf alle innerhalb des ganzen Conjoint-Interviews zu be- 
wertenden Stimuli und nicht auf die Anzahl an Stimuli innerhalb eines Choice-Sets. 

Ein Experimentdesign gilt als effizient, wenn die Varianzen und Kovarianzen der Parame- 
terschätzungen minimiert werden (vgl. Kuhfeld/Tobias/Garrat (1994), S. 545). 

Im Gegensatz dazu können insbesondere bei orthogonalen Designs lediglich die Hauptef- 
fekte geschätzt werden. Einzelne Interaktionseffekte können nur dann ermittelt werden, so- 
fern diese explizit im Experimentdesign integriert werden (vgl. Green/Srinivasan (1978), 
S. 110). 
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anderen Eigenschaften bei beiden Alternativen in der gleichen Ausprägung auf- 
treten.’^^ Der wesentliche Vorteil eines solchen Designs liegt darin, daß von den 
Auskunftspersonen nur solche Entscheidungen erfragt werden, deren Antwort, 
auf Basis bereits gewonnener Informationen, nicht a priori festzulegen bzw. zu 
erwarten ist. Unterscheiden sich beispielsweise zwei zu beurteilende Kühlschrän- 
ke nur in den Ausprägungen des Energieverbrauchs, kann davon ausgegangen 
werden, daß der Kühlschrank mit niedrigerem Verbrauch von den Probanden prä- 
feriert wird. Damit wird der Informationsgehalt des gesamten Interviews maxi- 
miert, indem mit jeder Entscheidung der Probanden möglichst neue Informatio- 
nen erhoben werden. 



Zur konkreten Umsetzung dieser Bedingung werden bei der CHIC für den Con- 
joint-Teil nur die Eigenschaftskombinationen aus dem vollständigen Design aus- 
gewählt, die bei mindestens zwei Eigenschaften unterschiedliche Ausprägungen 
aufweisen. Damit wird die Wahrscheinlichkeit, daß dominante Alternativen in 
einem Choice-Set auftreten, maßgeblich verringert, jedoch nicht vollkommen 
ausgeschlossen. Auf eine Sicherstellung der Pareto-Optimalität aller Stimuli wur- 
de verzichtet, da eine Konstruktion von Choice-Sets mit mehr als 2 Stimuli kaum 
noch möglich ist, bei denen nicht zumindest paarweise Dominanz auftritt. Dar- 
über hinaus liefern die Antworten hinsichtlich dominierter Alternativen eine 
Möglichkeit, die Reliabilität, d.h. die Konsistenz des Antwortverhaltens der Pro- 
banden zu überprüfen. 

Aufteilung der Stimuli auf die Choice-Sets 

Die zweite Fragestellung hinsichtlich der Designkonstruktion umfaßt wie bei al- 
len Choice-Experimenten die Aufteilung der Stimuli auf die einzelnen Choice- 
Sets. Eine Möglichkeit besteht darin, entsprechend fest vorgegebener Designplä- 



Vgl. Krieger/Green (1991), S. 337. 

Es sei an dieser Stelle angemerkt, daß pareto-optimale Designs nicht notwendigerweise 
orthogonal sind. Vielmehr stehen diese beiden Zielkriterien teilweise im Konflikt zueinan- 
der, schließen sich aber nicht grundsätzlich aus. Krieger/Green (1991) schlagen beispiels- 
weise eine Heuristik zur Designkonstruktion vor, bei der ausgehend von einem orthogona- 
len Design, die Pareto-Optimalität maximiert wird. Diese Heuristik kann zu gleichzeitig 
orthogonalen und pareto-optimalen Designs führen, stellt dies aber nicht in jedem Fall si- 
cher (vgl. Krieger/Green (1991), S. 343). Eine Verletzung der Orthogonalität bedeutet in- 
haltlich, daß zwischen den Eigenschaften des Designs Multikollinearität besteht, diese also 
nicht unabhängig voneinander sind. Inwieweit sich diese Prämissenverletzung auf die 
Schätzergebnisse auswirkt, kann a priori nicht getestet werden, sondern wird nachträglich 
bei der Datenauswertung überprüft. 
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ne vorzugehen. Alternativ dazu können die Stimuli auch zufällig auf die ver- 
schiedenen Choice-Sets aufgeteilt werden. Die CHIC als computergestütztes 
Interview ermöglicht eine solch zufällige Konstruktion der Choice-Sets und wird 
in der vorliegenden Programmversion angewandt. Damit wird neben der Eigen- 
schaftsauswahl für die Conjoint-Phase auch die Zusammenstellung der Choice- 
Sets individualisiert. Selbst wenn zwei Probanden gleiche Kerneigenschaften 
aufweisen und identische Präferenzen gegenüber den Ausprägungen geäußert 
haben, müssen die konstruierten Choice-Sets nicht übereinstimmen. Mit der zu- 
fälligen Aufteilung wird das Ausmaß der Individualisierung des Interviews zu- 
sätzlich erhöht und die Gefahr systematischer Verzerrungen aufgrund der Design- 
erstellung verringert. 

Bisher wurde erläutert, wie die Stimuli auf die verschiedenen Choice-Sets aufge- 
teilt werden können. In einem weiteren Schritt der Designkonstruktion sind deren 
Größe und Anzahl zu definieren. Zu berücksichtigen ist dabei, daß diese beiden 
Entscheidungen nicht unabhängig voneinander getroffen werden können. Bei 
gegebener Stimulizahl hängt die Anzahl zu konstruierender Choice-Sets unmit- 
telbar davon ab, wie viele Alternativen je Set betrachtet werden. Es gilt, einen 
Trade-Off zu machen zwischen wenigen umfangreichen einerseits und mehreren 
kleinen Choice-Sets andererseits. Die Frage nach der optimalen Anzahl an Alter- 
nativen in einem Choice-Set ist in der Literatur bisher kaum bearbeitet worden. 
So werten Johnson/Orme insgesamt 21 kommerzielle Choice-Based Conjoint- 
Studien aus und untersuchen u.a. den Einfluß der Anzahl an Choice-Sets insge- 
samt, geben aber keine Auskunft darüber, wie groß die Sets in den Studien je- 
weils waren. 

In der vorliegenden Version der CHIC werden in jedem Choice-Set 4 Produkt- 
konzepte und zusätzlich die Nicht-Kauf-Alternative berücksichtigt.'^"^ Mit der 



Zu den Grundlagen der Designerstellung bei Choice-Experimenten vgl. u.a. Louvie- 
re/Woodworth (1983), Kuhfeld/Tobias/Garratt (1994) und Huber/Zwerina (1996). 

Auch Louviere/Woodworth (1983) schlagen eine zufällige Designgestaltung als eine alter- 
native Vorgehensweise vor (vgl. Louviere/Woodworth (1983), S. 354). Die Choice-Based 
Conjoint Analysis von Sawtooth Software bietet ebenfalls die Möglichkeit einer zufälligen 
Designerstellung (vgl. Sawtooth Software (1995), S. 4). 

Vgl. hierzu Johnson/Orme (1996). 

Damit liegt die Anzahl simultan zu bewertender Stimuli bei der CHIC mit 4+1 Alternativen 
zwischen den anderen betrachteten Verfahren CCC (9 Stimuli) und ACA (2 Stimuli). 
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Nicht-Kauf-Altemative haben die Probanden die Möglichkeit, alle Produktalter- 
nativen eines Choice-Sets abzulehnen, sofern keine für sie attraktive Alternative 
angeboten wird. Mit dieser Größe der Choice-Sets werden bewußt mehr Stimuli 
pro Set präsentiert als bei der ACA, deren dekompositioneller Teil auf Paarver- 
gleichen basiert. Die Konstruktion größerer Choice-Sets ist prinzipiell möglich, 
in den meisten Untersuchungen jedoch nicht erforderlich, da die Gesamtzahl zu 
bewertender Stimuli durch die (nahezu) pareto-optimale Designkonstruktion stark 
reduziert wird. So unterscheiden sich beispielsweise in einem 3 *3 *3 *2 -De- 
sign‘^^ aus 4 Kerneigenschaften lediglich 14 Stimuli in mindestens 2 Ausprägun- 
gen und erfüllen somit die zur Designkonstruktion formulierte Nebenbedingung. 
Bei gegebener Anzahl an Alternativen insgesamt und pro Choice-Set ist die Zahl 
zu konstruierender Choice-Sets determiniert. Je nach Anzahl an Kemeigenschaf- 
ten und deren Ausprägungen werden bei der aktuellen Version der CHIC ledig- 
lich 3 oder 4 Choice-Sets konstruiert. Diese Größenordnung ist nicht mit den De- 
signs bei klassischen Choice-Experimenten zu vergleichen, bei denen die Pro- 
banden meist 16 bis 20 oder mehr Choice-Sets bewerten müssen. Dieser deutli- 
che Unterschied zwischen der CHIC und der eigentlichen Choice-Based Conjoint 
Analysis begründet sich darin, daß bei der CHIC für jedes Choice-Set wesentlich 
mehr Informationen erhoben werden als lediglich die einmalige Auswahlent- 
scheidung der am meisten präferierten Alternative, wie das bei der CBC der Fall 
ist. Die Präferenzabfrage der CHIC wird im folgenden Kapitel ausführlich erläu- 
tert. 

3.2.2.2 Form der Beurteilungsaufgabe 

Die Beurteilungsaufgabe der CHIC wird in ihrer Form zunächst an der klassi- 
schen Choice-Based Conjoint Analysis orientiert. Durch eine Auswahlentschei- 
dung, wie sie bei der Choice-Based Conjoint Analysis von den Probanden abver- 
langt wird, soll insbesondere der Realitätsbezug der Aufgabenstellung erhöht 
werden. Mit der CHIC wird jedoch zudem das Ziel verfolgt, individuelle Teilnut- 



Dieses Design impliziert, daß drei Kerneigenschaften 3 Ausprägungen und eine Kerneigen- 
schaft lediglich 2 Ausprägungen aufweisen. Das vollständige Design umfaßt demnach ins- 
gesamt 54 Eigenschaftskombinationen. 

Vgl. Elrod/Louviere/Davey (1992), S. 371; Louviere/Gaeth (1988), S. 68; Louvie- 
re/Fox/Moore (1993), S. 206; Louviere/Woodworth (1983), S. 355 ff; Moore/Gray- 
Lee/Louviere (1998), S. 200; Oliphant et al. (1992), S. 386. Die Programmversion von 
Sawtooth Software ermöglicht bei der Choice-Based Conjoint Analysis sogar bis zu 50 Ab- 
fragen. 
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zenwerte auch auf Basis der dekompositioneilen Interviewphase separat bestim- 
men zu können. Die klassische Choice-Based Conjoint Analysis ermöglicht da- 
gegen nur eine aggregierte Auswertung. Vor diesem Hintergrund wird die Da- 
tenerhebung der CHIC erweitert und umfaßt in der dekompositioneilen Phase 
folgende drei Teilschritte, die für jedes Choice-Set wiederholt werden: 

1 . Schritt: Auswahlentscheidung 

Der erste Schritt der Beurteilungsaufgabe entspricht dem Vorgehen der Choice- 
Based Conjoint Analysis und umfaßt eine Auswahlentscheidung aus dem präsen- 
tierten Choice-Set. Die Probanden werden gebeten, das Produkt auszuwählen, 
welches sie am ehesten kaufen bzw. für welches sie sich in der entsprechenden 
Kaufsituation entscheiden würden. Dabei haben die Auskunftspersonen auch die 
Möglichkeit, sich für keine der zur Wahl stehenden Alternativen zu entscheiden. 
Hierfür wird wie bei der Choice-Based Conjoint Analysis in jedem Choice-Set 
zusätzlich eine Nicht-Kauf- Alternative berücksichtigt. Die Integration dieser 
Nicht-Kauf-Alternative stellt einen wesentlichen Vorteil der Choice-Based Con- 
joint Analysis dar, da mit ihr zusätzlich der Realitätsbezug der Aufgabenstellung 
erhöht wird.’^^ 

Ein mit der klassischen Choice-Based Conjoint Analysis verbundener Nachteil 
betrifft die Ineffizienz der skizzierten Datenerhebung. Während der Proband le- 
diglich die für ihn beste Alternative pro Choice-Set identifiziert, müssen für diese 
Entscheidung die Informationen hinsichtlich aller Alternativen des Sets verar- 
beitet werden. Dieses Ungleichgewicht wird auch darin deutlich, daß der Erhe- 
bungsaufwand durch die zusätzliche Angabe der zweit- oder drittbesten Alterna- 
tive nur unwesentlich steigt, der zusätzliche Informationsgewinn aber im Ver- 
hältnis dazu wesentlich höher ist.'^^ Um die Effizienz der Datenerhebung zu er- 
höhen und die Datengrundlage für eine individuelle Schätzung der Teilnutzen- 
werte zu schaffen, wird die Auswahlentscheidung auch innerhalb der Choice-Sets 
wiederholt. Das Choice-Set wird hierfür um die am meisten präferierte Alternati- 
ve reduziert und die Probanden erneut befragt, welche Alternative sie aus diesem 
verkleinerten Set am ehesten auswählen würden. Nach Abschluß dieser wieder- 
holten Auswahlentscheidung liegt damit implizit eine Rangfolge mit absteigender 



Vgl. hierzu auch Oliphant et al. (1992), S. 385; Louviere/Gaeth (1988), S. 62. 
Vgl. Johnson/Orme (1996), S. 1 1. 
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Präferenz für die Produkte innerhalb eines Choice-Sets vor. Sofern die Nicht- 
Kauf-Alternative gewählt wird, werden im Anschluß dennoch die Präferenzen 
zwischen den Alternativen des Choice-Sets erfragt. Die Bewertung erfolgt dann 
unter der Annahme, daß keine anderen Produktalternativen zur Verfügung stehen. 
Somit werden zumindest noch Infonnationen zu den Präferenzen zwischen den 
verschiedenen Alternativen innerhalb des betreffenden Sets erhoben. Die Wahl 
der Nicht-Kauf- Alternative wird anschließend bei der Ableitung einer Gesamt- 
rangfolge für alle bewerteten Stimuli berücksichtigt. 

2. Schritt: Quantifizierung der Präferenzunterschiede 

Nach den einzelnen Auswahlentscheidungen liegt implizit eine Präferenzrangfol- 
ge für die Alternativen innerhalb eines Choice-Sets vor. Ziel des zweiten Befra- 
gungsschritts ist es, die Präferenzunterschiede zwischen den ermittelten Rang- 
plätzen zu quantifizieren. Dies liefert detaillierte Informationen hinsichtlich der 
Präferenzen und ist zudem Voraussetzung für eine Vergleichbarkeit der Präfe- 
renzurteile zwischen den verschiedenen Choice-Sets. Um diese Bewertung für 
die Probanden zu vereinfachen, werden die Produktalternativen auf dem Bild- 
schirm gemäß der implizit erhobenen Rangfolge sortiert. Die Quantifizierung der 
Präferenzunterschiede wird mit einer von 0 bis 100 Punkten definierten Rating- 
Skala vorgenommen, wobei ein höherer Wert eine höhere Präferenz bedeutet. Die 
Endpole dieser Rating-Skala werden wiederum mit der am meisten präferierten 
(100 Punkte) und am wenigsten präferierten (0 Punkte) Alternative fixiert und 
dienen als Ankerpunkte bei der Bewertung der anderen Alternativen.^®^ Aufgabe 
der Probanden ist dann, den mittleren Alternativen entsprechend der individuel- 
len Präferenz einen Wert zwischen 0 und 100 Punkten zuzuweisen. Die Rating- 
Skala wird gleichzeitig auf dem Bildschirm grafisch abgebildet, um die Unter- 
schiede zwischen den bewerteten Präferenzen sowohl anhand der zugeordneten 
Punktwerte als auch grafisch zu visualisieren. Damit wird die Gefahr eines „in- 
formation overload“, d.h. einer Informationsüberlastung der Probanden redu- 
ziert.^®* 



Vgl. hierzu auch Elrod/Louviere/Davey (1992), S. 370. 

^®® Für diese Verankerung spricht, wie bei der Erfassung der Wichtigkeiten für die Eigen- 
schaften in der Self-Explicated-Phase, daß dadurch die Wahrscheinlichkeit erhöht wird, die 
Präferenzunterschiede tatsächlich auf einer Ratio-Skala zu messen. 

^®* Vgl. Loosschilder et al. ( 1 995), S. 20. 
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3. Schritt: Transformation der Präferenzunterschiede in eine monetäre Größe 



Auf Basis der Rating-Skala werden die Unterschiede innerhalb eines Choice-Sets 
quantifiziert. Um die Vergleichbarkeit der Präferenzunterschiede zwischen den 
einzelnen Choice-Sets zu gewährleisten, muß sichergestellt werden, daß die Be- 
wertungsvorschrift von jedem Proband in jedem Set gleich interpretiert wird. 
Durch die Verankerung der am meisten präferierten und am wenigsten präferier- 
ten Alternative werden dazwischenliegende Produktkonzepte immer in Relation 
dazu auf der Rating-Skala bewertet werden. Problematisch allerdings ist, daß da- 
durch die Bewertung eines Produkts auf dieser Skala immer davon abhängt, wel- 
che Alternativen innerhalb des jeweiligen Choice-Sets noch zur Wahl stehen.^®^ 
So kann beispielsweise eine Alternative aus einem Choice-Sets als Erstpräferenz 
hervorgehen und mit 100 Punkten bewertet werden, die innerhalb eines anderen 
Choice-Sets als wesentlich schlechter beurteilt würde. 

Eine individuelle Schätzung der Teilnutzenwerte auf Basis der dekompositionel- 
len Phase, wie sie bei der CHIC beabsichtigt ist, setzt jedoch gerade die Ver- 
gleichbarkeit der Präferenzurteile zwischen den einzelnen Choice-Sets voraus. 
Um dem Effekt einer unterschiedlichen Skaleninterpretation und damit einge- 
schränkter Vergleichbarkeit zwischen verschiedenen Choice-Sets entgegenzuwir- 
ken, werden die Präferenzunterschiede in eine monetäre Größe transformiert. Da- 
für wird die Auskunftsperson in diesem dritten Schritt der Stimulibewertung ge- 
beten, den Unterschied zwischen zwei Stimuli des Choice-Sets in einem DM- 
Betrag zu bewerten. Damit können die im zweiten Schritt der Beurteilungsaufga- 
be erhobenen Punktwerte in DM-Beträge umgerechnet und Unterschiede in der 
Interpretation der Punktwerte der Rating-Skala bereinigt werden. Neben einer 
besseren Vergleichbarkeit der Skalenwerte über die Choice-Sets bietet diese 
Transformation der Skalenwerte in DM-Beträge zusätzlich die Möglichkeit, die 
Präferenzunterschiede in Form einer direkt angegebenen Zahlungsbereitschaft für 
die entsprechenden Eigenschaftsausprägungen zu messen. Nach allen 3 beschrie- 



Diese Problematik wird in der Literatur unter dem Begriff „Independence from Irrelevant 
Alternatives (kurz: HA)“ diskutiert und besagt, daß der Gesamtnutzen einer Alternative un- 
abhängig davon ist, welche Alternativen noch im Choice-Set vorhanden sind. Dies Annah- 
me stellt ebenfalls eine Besonderheit der klassischen Choice-Based Conjoint Analysis dar. 
Zur Defmiton der IIA-Eigenschaft vgl. Louviere/Woodworth (1983), S. 352. 
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benen Befragungsschritten liegt für die Stimuli innerhalb eines Choice-Sets eine 
Präferenzrangfolge vor, deren Unterschiede in DM-Beträgen quantifiziert sind. 

3.2.2.3 Schätzung der Teilnutzenwerte 

Eine individuelle Auswertung der Präferenzdaten beispielsweise mittels einer 
OLS-Schätzung ist erst dann möglich, wenn als abhängige Variable einer solchen 
Schätzung eine Gesamtreihenfolge aller bewerteten Stimuli vorliegt. Bisher lie- 
gen metrische Präferenzaussagen nur hinsichtlich der Stimuli innerhalb der ein- 
zelnen Choice-Sets vor. Um Stimuli aus unterschiedlichen Choice-Sets miteinan- 
der vergleichen zu können und alle bewerteten Produkte in eine bewertete Ge- 
samtreihenfolge sortieren zu können, müssen die Ergebnisse der Choice-Sets mit- 
einander verankert werden. Eine Möglichkeit hierfür besteht darin, bereits bei der 
Konstruktion der Choice-Sets eine entsprechende Verankerung sicherzustellen. 
Treten in jedem Choice-Sets wenigstens 2 Stimuli immer wieder auf, ist ein di- 
rekter Vergleich der Skalenwerte zwischen der Sets möglich. Die in allen Sets 
enthaltenen Stimuli bilden eine „Brücke“ zwischen den Sets und dienen als An- 
kerpunkt für alle anderen Vergleiche. Wenn in jedem Choice-Set der Präferenz- 
unterschied zwischen zwei identischen Stimuli quantifiziert ist, werden die Ska- 
lenwerte über alle Choice-Sets miteinander vergleichbar. Gleichzeitig ist damit 
die Unabhängigkeit der Skaleninterpretation von der Zusammensetzung eines 
Sets sichergestellt. Nachteilig an einer solchen Designkonstruktion ist allerdings 
die damit verbundene Erhöhung des Erhebungsaufwands. Pro Choice-Set werden 
jeweils nur Informationen für 2 weitere Stimuli erhoben. Bei konstanter Stimuli- 
zahl sind folglich insgesamt mehr Choice-Sets zu bewerten. Eine weitere Gefahr 
ist, daß Probanden die wiederholte Bewertung identischer Stimuli als Konsi- 
stenzprüfung auffassen und anstatt tatsächlicher Präferenzunterschiede bewußt 
immer wieder die gleichen Skalenwerte angeben. 

Für die derzeitige Programmversion der CHIC wird daher eine alternative Vorge- 
hensweise gewählt, um die bewerteten Stimuli in eine metrische Gesamtreihen- 
folge zu bringen. Die Verankerung der einzelnen Choice-Sets wird nachträglich 
auf Basis der Informationen aus der Self-Explicated-Phase vorgenommen. Mit 
Hilfe der Self-Explicated-Teilnutzenwerte für die Eigenschaft „Preis“ werden die 
Gesamtnutzenwerte der verschiedenen Stimuli in DM-Beträge transformiert, die 
als maximale Zahlungsbereitschaft für das jeweilige Produkt interpretiert werden 
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kann.^®^ Diese Zahlungsbereitschaft stellt dabei eine absolute Größe dar, die ei- 
nen direkten Vergleich über die verschiedenen Sets ermöglicht. Berechnet man 
für alle Stimuli auf Basis der Self-Explicated-Teilnutzen die jeweilige Zahlungs- 
bereitschaft, liegt damit eine metrische Gesamtreihenfolge aller Stimuli vor. Dies 
würde allerdings implizieren, daß die Erfassung der Präferenzstrukturen auf Basis 
der Self-Explicated-Phase verzerrungsfrei gelingt. Da davon nicht ausgegangen 
werden kann, wird lediglich die Zahlungsbereitschaft für den Stimulus in jedem 
Choice-Set berechnet, der anschließend zur Verankerung der Skalen zwischen 
den Choice-Sets dient. In der vorliegenden Untersuchung wird die Zahlungsbe- 
reitschaft für das in jedem Choice-Set am schlechtesten bewertete Produkt be- 
rechnet.^^"^. Damit werden die Endpole der Rating-Skala miteinander verankert 
und sind direkt vergleichbar. Die durch die Schritte 1 bis 3 des Conjoint- 
Interviews ermittelten DM-Beträge für jedes Choice-Set werden daraufhin so 
umskaliert, daß zum einen die Präferenzunterschiede innerhalb eines Choice-Sets 
abgebildet werden und zum anderen die Choice-Sets als ganzes entsprechend der 
Self-Explicated-Zahlungsbreitschaften miteinander verankert werden. Die Vor- 
gehensweise zur Verankerung der verschiedenen Choice-Sets wird anhand eines 
vereinfachten Beispiels in Abbildung 3-3 mit 2 Sets veranschaulicht: 



Einschränkend muß angemerkt werden, daß die maximale Zahlungsbereitschaft nicht ex- 
plizit als solche von den Probanden erhoben wurde, sondern aus den gegebenen Informa- 
tionen abgeleitet wird. Da Abweichungen zur tatsächlich maximalen Zahlungsbereitschaft 
der Probanden auftreten können, ist die vorgenommene Interpretation nicht unproblema- 
tisch. Für die Vergleichbarkeit der Präferenzunterschiede zwischen den alternativen Pro- 
duktalternativen ist die Erfassung der tatsächlich maximalen Zahlungsbereitschaft nicht 
zwingend erforderlich, was die Problematik der vorgenommenen Interpretation zumindest 
teilweise reduziert. 

Alternativ können sowohl die jeweils am besten oder dazwischen eingestufte Produkte zur 
Verankerung herangezogen werden. Empfohlen wird aber eine der beiden Eckwerte der 
Skala zu verwenden, da sich in der vorliegenden empirischen Untersuchung zeigte, daß 
sich dabei die geringsten Inkonsistenzen zwischen der auf Basis der Self-Explicated- 
Befragung geschätzten und im Conjoint-Teil beobachteten Reihenfolge ergab. 
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Abbildung 3-3: Beispiel zur Umskalierung der Präferenzwerte in der Conjoint- 
Phase der CHIC 



a) Vorliegende Bewertungen innerhalb eines Choice-Sets nach der Datenerhebung: 
(Punktewerte der Rating-Skala sind bereits in DM-Beträge transformiert) 



Choice-Set 2 


Stimulus E 


400,- DM 


Stimulus F 


200,- DM 


Stimulus G 


100,- DM 


Stimulus H 


0,- DM 



Choice-Set 1 


Stimulus A 


650,- DM 


Stimulus B 


400,- DM 


Stimulus C 


180,- DM 


Stimulus D 


0,- DM 



b) Auf Basis der Self-Explicated-Phase ermittelte maximale Zahlungs- 
bereitschaften für die beiden am wenigsten präferierten Stimuli je Choice-Set: 



Stimulus D 


20,- DM 




Stimulus H 


200,- DM 



c) Umskalierte Präferenzwerte nach Verankerung der beiden Choice-Sets: 



Choice-Set 2 


Stimulus E 


580,- DM 


Stimulus F 


380,- DM 


Stimulus G ** 




Stimulus H * 


180,- DM 



Choice-Set 1 


Stimulus A 


650,- DM 


Stimulus B 




Stimulus C 




Stimulus D 


0,- DM 



Anmerkung: 

* Der Präferenzwert für Stimulus H beträgt jetzt 180,- DM, da die Zahlungsbereitschaft (nach SE- 
Daten) um diesen Betrag höher ist als die des am wenigsten präferierten Stimulus D aus Set 1 
=> Verankerung der Choice-Sets zueinander 

** Die Bewertungen der Conjoint-Phase haben ergeben, daß der Präferenzwert für Stimuli G um 
100,- DM höher gegenüber Stimulus H ist. 

=> Berücksichtigung der Präferenzen innerhalb eines Choice-Sets ermittelt aus der Conjoint-Phase 
des Interviews. 



Quelle: Eigene Erstellung 

Nach dieser Umskalierung der DM-Beträge können alle bewerteten Stimuli in 
eine metrische Gesamtreihenfolge gebracht werden. Diese dient als Grundlage 
für eine Schätzung der Teilnutzenwerte für die Kerneigenschaften. Aufgrund der 
vorliegenden metrischen Skalenniveaus empfiehlt sich hier die Anwendung einer 
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OLS-Schätzung, um alle vorhandenen Informationen auch in der Schätzung zu 
berücksichtigen.^®^ 

3.2.3 Kombinationsphase 

Wie bei der CCC liegen bei der CHIC für die Kerneigenschaften des i-ten Pro- 
banden Ci sowohl Teilnutzenwerte unter Verwendung der Informationen der 
Self-Explicated- als auch der Conjoint-Phase vor. Grundidee der CHIC ist auch 
hier, diese beiden Teilnutzenwerte optimal zu kombinieren, um die tatsächlichen 
Präferenzstrukturen der Probanden bestmöglich abzubilden. Als Referenzgröße 
dienen analog zur CCC, die erhobenen Präferenzen für ein zusätzliches Validati- 
on-Set. Ziel ist es, diese beobachteten Präferenzurteile auf Basis der kombinierten 
Teilnutzenwerte aus Self-Explicated- und Conjoint-Phase möglichst gut zu pro- 
gnostizieren. Als Validation-Set werden die Präferenzen eines zusätzlichen 
Choice-Sets herangezogen, welche nicht in die Schätzung der Conjoint- 
Teilnutzenwerte eingehen. Die Vorgehensweise zur Ermittlung der optimalen 
Kombination der Teilnutzen werte entspricht dem der CCC auf deren wiederholte 
Darstellung an dieser Stelle verzichtet wird. Zudem werden ebenfalls aufgrund 
der in Kapitel 3.1.3 angeführten Argumentation die beiden alternativen Berech- 
nungsformeln zur Bestimmung der Gesamtnutzenwerte bei neuen Produkten her- 
angezogen. Zur Unterscheidung der jeweils eingesetzten Schätzmethode wird im 
folgenden in Anlehnung an die Notation der CCC zwischen CHIC-alt und CHIC- 
neu differenziert. Abbildung 3-4 faßt den Interviewablauf der CHIC noch einmal 
zusammen. 



Vgl. Green/Srinivasan (1978), S. 113. 
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Abbildung 3-4: Interviewablauf der CHIC 



Phase 


Befragungsschritt 


Vorgehensweise bei der CHIC 


1 

, ^ « 


Zur Vorgehensweise vgl. Self-Explicated-Phase der CCC (vgl. Abbildung 3-2) 




Ermittlung der Teilnutzenwerte führt zur SE-CHIC 




1. Schritt: Auswahlentscheidungen 


• Auswahlentscheidung aus einem Choice-Set 






bestehend aus 4 bis 6 Alternativen, die durch 
die 3 bis 6 wichtigsten Eigenschaften be- 
schrieben sind 




> Präferenzrangfolge innerhalb 


• Wiederholung der Auswahlentscheidung aus 




eines Choice-Sets wird erfaßt 


den verbliebenen Alternativen 


'S 

c« 


2. Schritt: Quantifizierung der Prä- 


•Auf einer Rating-Skala mit 100 bis 0 Punk- 


i 

O 

.fl 


ferenzunterschiede 


ten werden die zuerst ausgewählte (100 
Punkte) und die zuletzt ausgewählte Alter- 


U 

« 




native (0 Punkte) fixiert 


V 

CO 




• Vergabe von 0 bis 100 Punkten für dazwi- 


fl 

XI 


> Präferenzunterschiede inner- 
halb eines Choice-Sets werden 
quantifiziert 


schenliegende Alternativen die an zweiter. 


0H 

’fl* 


dritter usw. Stelle ausgewählt wurden. Die 
beiden Extrempole dienen dabei als Anker- 
punkte 


o 

U 


3. Schritt: Transformation der Prä- 


• Direkte Frage nach einem DM-Betrag zur 




ferenzunterschiede in eine monetäre 


Quantifizierung des Präferenzunterschieds 




Größe 


zwischen 2 Alternativen des Choice-Sets 




> Präferenzunterschiede werden 






in DM ausgedrückt und Ver- 
gleichbarkeit über verschiedene 
Sets wird gewährleistet 




^ 1 


Kombination der Informationen aus 


• Wiederholung der 3 Befragungsschritte der 


a i 


den beiden vorangegangenen Be- 


Conjoint-Phase für mindestens ein zusätzli- 


■1 -S 


fragungsteilen 


ches Choice-Set 


u 

1 S 


Ermittlung der kombinierten Gesamtnutzenwerte gemäß 




Gleichung (3-3) bzw. (3-4) führt zur CHIC-alt bzw. CHIC-neu 



Quelle: Eigene Erstellung 



3.3 Adaptive Conjoint Analysis (ACA) 

Die von Johnson (1987) entwickelte ACA hat sich mittlerweile insbesondere in 
der kommerziellen Anwendung zum Standardinstrument fiir die Messung von 
Nachfragerpräferenzen etabliert. Sie stellt das bisher einzig computergestützte 
adaptive Verfahren dar, das als kommerzielle Software erhältlich ist.^^^ Ein we- 
sentlicher Vorteil der ACA gegenüber den beiden bisher vorgestellten Verfahren 



Vgl. Carmone/Schaffer (1995), S. 117. 
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CCC und CHIC liegt darin, daß die gesamte Datenerhebung computergestützt 
abläuft und gleichzeitig die Datenauswertung bis hin zu verschiedenen Simulati- 
onsmodellen in der Software integriert ist. Diese Benutzerfreundlichkeit in der 
Anwendung ist sicherlich ein Grund, für die sehr weite Verbreitung des Verfah- 
rens.^®^ Die ACA wird als drittes Verfahren der computergestützten hybriden An- 
sätze dargestellt. Während der Ablauf der ACA von anderen Autoren in 4 ver- 
schiedene Phasen eingeteilt wird, werden die folgenden Ausführungen aus Grün- 
den der Vergleichbarkeit zur CCC und CHIC entsprechend der bisherigen Vor- 
gehensweise gegliedert.^®^ Gleichzeitig werden die Unterschiede zu den beiden 
anderen Verfahren bei den einzelnen Teilschritten aufgezeigt. 

3.3.1 Seif-Explicated-Phase 

Die Datenerhebung des kompositioneilen Interviewteils der ACA umfaßt wie 
CCC bzw. CHIC 3 Teilschritte, die sich in ihrer Gestaltung aber teilweise von 
denen der SE-CCC bzw. SE-CHIC unterscheiden. 

3.3.1. 1 Datenerhebung 

1. Schritt: Eliminierung inakzeptabler Eigenschaftsausprägungen 

Dieser erste Teilschritt ermöglicht der Auskunftsperson jeweils inakzeptable 
Ausprägungen bei einer Eigenschaft zu eliminieren und vom folgenden Inter- 
viewablauf auszuschließen. Es handelt sich dabei um einen Befragungsschritt, der 
vom Marktforscher optional in die Untersuchung integriert werden kann.^®^ 

2. Schritt: Erfassung von Präferenzen zu den Eigenschaftsausprägungen 

Zur Beurteilung der Präferenzen hinsichtlich der Eigenschaftsausprägungen kann 
der Anwender bei der ACA zwischen zwei alternativen Vorgehensweisen wäh- 
len. Zum einen besteht die Möglichkeit, Präferenzrangfolgen für die Ausprägun- 
gen jeder Eigenschaft zu erfragen. Zum anderen kann eine vom Benutzer defi- 
nierte Rating-Skala (mit 2 bis 9 Kategorien) eingesetzt werden, um Präferenzen 
gegenüber den verschiedenen Eigenschaftsausprägungen zu erheben.^'® 



Vgl. Green/Srinivasan (1990), S. 1 1. 

^®^ Vgl. Green/Krieger/Agarwal (1991), S. 216; Reiners (1996), S. 115 Weiber/Rosendahl 
(1997), S. 110. 

^®^ Vgl. Johnson (1987), S. 259. 

^'® Vgl. Metegrano( 1994), S. 3-4. 
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Die vorliegende Software der ACA ermöglicht es, bis zu 9 Ausprägungen einer 
Eigenschaft in einer Studie zu integrieren. Trotzdem wird wie bei der CCC und 
der CHIC nur eine Teilmenge dieser Ausprägungen in der folgenden dekomposi- 
tionellen Phase berücksichtigt. Während bei der CCC und CHIC max. 3 Ausprä- 
gungen ausgewählt werden, liegt die Obergrenze bei der ACA bei 5 Ausprägun- 
gen. Die Auswahl kann direkt durch das System erfolgen. Berücksichtigt werden 
dann die Eigenschaftsausprägungen, die im vorangegangenen Befragungsschritt 
am meisten präferiert wurden. Alternativ können die Probanden nach den 5 Aus- 
prägungen gefragt werden, deren Auftreten bei einem gewählten Produkt am 
wahrscheinlichsten ist. Letzteres Vorgehen bietet den Vorteil zwischen präfe- 
rierten und tatsächlich akzeptierten Ausprägungen zu differenzieren. Abweichun- 
gen zwischen präferierten und tatsächlich akzeptierten Ausprägungen sind durch- 
aus denkbar. So können Probanden eine bestimmte Marke durchaus präferieren, 
würden sich aber z.B. unter Berücksichtigung des Preises dieser Marke nicht für 
diese entscheiden.^’ ' 

Auch die ACA gibt dem Marktforscher die Möglichkeit, auf die Präferenzabfrage 
bei quantitativen Eigenschaften zu verzichten.^ Unter der Annahme, daß alle 
anderen Eigenschaften konstant sind, kann beispielsweise die Frage nach der Prä- 
ferenz zwischen verschiedenen Preisen in den meisten Untersuchungen ausge- 
klammert werden. Durch den Verzicht auf solche a priori festzulegende Abfragen 
kann die Interviewzeit verkürzt und die Effizienz der Datenerhebung erhöht wer- 
den. Im Gegensatz zur CCC und CHIC entfällt bei der ACA in diesem Fall die 
Bewertung der Ausprägungen dieser Eigenschaft insgesamt.^ Damit wird bei 
der ACA implizit für diese Eigenschaften eine über alle Ausprägungen lineare 
Teilnutzenfunktion unterstellt. Diese einschränkende Annahme ist durchaus kri- 
tisch zu bewerten, denn sie impliziert z.B. für die Eigenschaft „Preis“, daß jede 
relative Preisänderung sich in gleichem Maße auswirkt. Davon kann jedoch nicht 
grundsätzlich ausgegangen werden. Vor allem beim Überschreiten möglicher 



Vgl. Metegrano (1994), S. 3-5 f 
Vgl. Johnson (1987), S. 260. 

Bei den beiden anderen Verfahren werden an dieser Stelle lediglich die jeweils am meisten 
und am wenigsten präferierte Ausprägung a priori festgelegt. Alle weiteren Ausprägungen 
sind von den Probanden zwischen diesen Endpunkten einzuordnen. 
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Preisschwellen ist kein linearer Zusammenhang zwischen dem Preis und dem 
damit verbundenen Nutzen für die Probanden zu erwarten.^*'^ 

3. Schritt: Abfrage der Wichtigkeiten der Eigenschaften 

Nachdem die für jede Testperson max. 5 relevanten Ausprägungen identifiziert 
sind, werden die Wichtigkeiten der Eigenschaften erfragt. Hierfür erscheinen die 
jeweils beste und schlechteste Ausprägung einer Eigenschaft. Damit wird auch 
bei diesem Verfahren die Frage nach der Wichtigkeit einer Eigenschaft in Ver- 
bindung mit deren Ausprägungen gestellt. Die Bedeutung des Unterschieds zwi- 
schen bester und schlechtester Eigenschaftsausprägung, als Definition für die 
Wichtigkeit einer Eigenschaft, wird wiederum auf einer Rating- Skala bewertet, 
für die zwischen 2- und 9-Skalenpunkte festgelegt werden können.^ 

In diesem Befragungsschritt liegt der bedeutendste Unterschied zwischen dem 
Self-Explicated-Teil der ACA und dem der beiden neuen Verfahren. Während bei 
der CCC und der CHIC die jeweils wichtigste Eigenschaft für die Beurteilung der 
anderen Eigenschaften als Ankergröße fungiert, werden bei der ACA alle Eigen- 
schaften separat betrachtet. Für jede Eigenschaft wird jeweils unabhängig von 
allen anderen die Frage nach der Wichtigkeit wiederholt. Diese separate Beurtei- 
lung birgt die Gefahr, daß die Skalen nicht über alle Eigenschaften hinweg konsi- 
stent interpretiert werden und deren direkter Vergleich dadurch nur eingeschränkt 
zulässig ist. Darüber hinaus verlangt die Self-Explicated-Phase der CCC und der 
CHIC bereits an dieser Stelle des Interviews eine relative Bewertung der Eigen- 
schaften zueinander. Dieses erste Abwägen erhöht gleichzeitig die Wahrschein- 
lichkeit, die Wichtigkeiten der Eigenschaften tatsächlich auf einer Ratio-Skala zu 
erheben, was Voraussetzung für deren metrische Interpretation ist.^’^ 

3.3.1.2 Schätzung der Teilnutzenwerte 

Die ACA berechnet ebenfalls bereits auf Basis der in der Self-Explicated-Phase 
erhobenen Daten Teilnutzen werte für die Eigenschaftsausprägungen. Die Schät- 
zungen basieren ebenfalls auf dem multiattributiven Präferenzmodell, bei dem 



Zur Definition von Preisschwellen und damit verbundenen Effekten vgl. Gedenk/Sattler 
(1999). 

Vgl. Metegrano( 1994), S. 3-6. 

Vgl. Srinivasan( 1988), S. 296. 
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die erhobenen Präferenzen für die Eigenschaftsausprägungen mit den Wichtig- 
keiten der Eigenschaften multipliziert werden. Als Ergebnis der Self-Explicated- 
Phase liefert die ACA Teilnutzen werte für alle Ausprägungen, deren Spannbreite 
das Bedeutungsgewicht einer Eigenschaft widerspiegeln. Darüber hinaus sind die 
Teilnutzen werte so normiert, daß die Summe über jede Eigenschaft 0 ergibt.^ 
Die formale Darstellung des Modells zur Schätzung der Teilnutzenwerte ent- 
spricht dem allgemeinen multiattributivem Präferenzmodell in Kapitel 2.1.^'^ 

3.3.2 Conjoint-Phase 

Die Paarvergleichsaufgabe stellt das eigentliche Kernstück der ACA dar.^’^ Für 
jeden Paarvergleich wird erfragt, welches der beiden Produktkonzepte der Pro- 
band bevorzugt und wie stark dieses bevorzugt wird. Die Präferenz wird auf einer 
9-Punkte Rating-Skala quantifiziert und die Stimuli von 2 bis max. 5 Eigen- 
schaften beschrieben.^^® Während eine größere Anzahl an Eigenschaften einen 
höheren Realitätsbezug der Produktbeschreibung bewirkt, steigt die Zahl zu ver- 
arbeitender Informationen. Aufgrund der damit verbundenen höheren Aufgaben- 
komplexität wird empfohlen, 2 oder max. 3 Eigenschaften zur Stimulibeschrei- 
bung heranzuziehen.^^’ Dabei besteht die Möglichkeit die Zahl der Eigenschaften 
im Interviewablauf zu steigern und zunächst 2 und nach mehreren beantworteten 
Paarvergleichen, die folgenden Stimuli anhand von 3 Eigenschaften zu beschrei- 
ben. 

Neben dieser geringeren Anzahl simultan zu beurteilender Stimuli unterscheidet 
sich die ACA sowohl in der Konzeption der Paarvergleiche (und damit hinsicht- 
lich der Designkonstruktion) als auch in der Schätzung der Teilnutzenwerte ge- 
genüber den beiden neuen computergestützten Verfahren. Die Gestaltung der 
Paarvergleiche wird während des gesamten Interviews von den Antworten des 
Probanden beeinflußt. Ausgehend von den Teilnutzenwerten der Self-Explicated- 
Phase werden die Paare so konstruiert, daß deren bis dahin ermittelte Gesamtnut- 



Zur Berechnung der Teilnutzen werte auf Basis der Self-Explicated-Phase vgl. Metegrano 
(1994), S.G-1 f 

Sofern die Präferenzen hinsichtlich der Eigenschaftsausprägungen mit einer Rangfolge 
erfaßt wurden, müssen diese zunächst in die umgekehrte Reihenfolge konvertiert werden. 
Vgl. auch Green/Krieger/Agarwal (1991), S. 216 und Gutsche (1995), S. 96. 

Vgl. Metegrano (1994), S. 3-7 f 
Vgl. Johnson (1987), S. 261. 
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zen möglichst ähnlich sind. Dieses Vorgehen dient wie die Pareto-Optimalität der 
Effizienzsteigerung der Datenerhebung. Je ähnlicher die Gesamtnutzen zweier 
Produktkonzepte sind, desto geringer ist die Wahrscheinlichkeit, daß eine Alter- 
native eine andere eindeutig dominiert. Umgekehrt formuliert deuten große Un- 
terschiede zwischen den Gesamtnutzen darauf hin, daß eine der beiden Alternati- 
ven eindeutig präferiert wird. Dieser Effekt tritt insbesondere dann auf, wenn die 
Alternativen überwiegend durch quantitative Eigenschaften beschrieben sind, bei 
denen die Präferenzen hinsichtlich der Ausprägungen bereits a priori definiert 
werden können. Nach jeder Bewertung eines Paarvergleichs werden die ermit- 
telten Gesamtnutzen aktualisiert und damit die Wahl des nächsten Paarvergleichs 
determiniert. Gleichzeitig nimmt die Bedeutung der Ausgangsschätzungen auf 
Basis der Self-Explicated-Phase mit jedem zusätzlichen Paarvergleich ab. Das 
Zielkriterium, Paarvergleiche mit möglichst gleichen Gesamtnutzen zu konstruie- 
ren, wird unter der Nebenbedingung erfüllt, daß das Gesamtdesign näherungs- 
weise orthogonal ist. 

Verbunden mit dem adaptiven Charakter der Paarvergleiche unterscheidet sich 
die ACA auch wesentlich hinsichtlich der Schätzung der Teilnutzenwerte der de- 
kompositionellen Phase. Sowohl bei der CCC als auch der CHIC basieren die 
Schätzergebnisse der Conjoint-Phase auf einer einmaligen Schätzung unter si- 
multaner Auswertung aller erhobenen Informationen. Bei der ACA dagegen fin- 
det nach jedem Paarvergleich eine Aktualisierung der Schätzwerte statt. Als Aus- 
gangspunkt dienen die auf Basis der Self-Explicated-Phase geschätzten Teilnut- 
zenwerten, die mittels OLS-Schätzung mit den Schätzungen der Paarvergleiche 
kombiniert werden.^^^ Diese werden mit jedem Paarvergleich aktualisiert und 
verfeinert, wobei das Gewicht der Self-Explicated-Teilnutzenwerte mit jedem 
zusätzlichen Paarvergleich geringer wird. Dieser Prozeß wird solange wiederholt 
bis ein entsprechend (vom Anwender) vorgegebenes Maß an Stabilität der Schät- 
zung erfüllt ist oder die vorher festgelegte Zahl an Paarvergleichen beantwortet 
wurde. Durch die ständige Anpassung der Konstruktion der Paarvergleiche und 
die schrittweise Aktualisierung der Schätzergebnisse ist der Grad der Anpassung 
im Vergleich zu den beiden neuen Verfahren am höchsten. Während bei der CCC 
und CHIC lediglich eine Anpassung zwischen Self-Explicated-Phase und Con- 

Zum Schätzmodell für die Paarvergleichsaufgabe vgl. auch Green/Krieger/Agarwal (1991), 

S. 217. 
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joint-Phase stattfindet, wird diese bei der ACA auch innerhalb der Paarver- 
gleichsaufgabe vorgenommen. Trotzdem ist es gerade die Paarvergleichsaufgabe, 
die aufgrund ihrer Ineffizienz in der Datenerhebung kritisiert wird.^^^ Darüber 
hinaus bewerten Green/Krieger/Agarwal (1991) die Paarvergleichsaufgabe der 
ACA als sehr unrealistisch und durch die konstruierte Indifferenz zwischen den 
Konzepten für die Probanden sehr schwer zu bewältigen. 

Insgesamt kann an dieser Stelle festgehalten werden, daß sich die Conjoint-Phase 
der ACA in drei wesentlichen Merkmalen von den beiden neuen Verfahren CCC 
und CHIC unterscheidet. Zunächst sind jeweils nur 2 Stimuli in der dekomposi- 
tioneilen Phase simultan zu beurteilen. Des weiteren wird nicht nur zwischen 
Self-Explicated-Phase und Conjoint-Phase eine Anpassung vorgenommen, son- 
dern bei der ACA ist auch die Paarvergleichsaufgabe in sich adaptiv gestaltet. 
Damit verbunden findet statt einer einmaligen Schätzung der Teilnutzen werte 
eine kontinuierliche Anpassung der Schätzwerte statt, so daß nach dem letzten 
Paarvergleich Teilnutzenwerte vorliegen, die im Verlauf der dekompositionellen 
Phase entstanden bzw. ständig aktualisiert worden sind. 

3.3.3 Kombinationsphase 

Entsprechend der CCC und der CHIC liefert die ACA zwei getrennte Schätzun- 
gen für die beiden beschriebenen Interviewphasen. Zum einen die Schätzergeb- 
nisse auf Basis der Self-Explicated-Phase und zum anderen die im Verlauf der 
Paarvergleichsaufgabe aktualisierten Teilnutzenwerte. Die Kombinationsphase 
dient dazu, eine individuelle Gewichtung für diese beiden Ergebnisse zu bestim- 
men. Grundlage hierfür ist wiederum ein Validation-Set, mit dem das ACA- 
Interview abgeschlossen wird. Dieses Validation-Set besteht aus mindestens 4 bis 
max. 8 Produktkonzepten, wobei die Anzahl an Eigenschaften ebenfalls die 
Obergrenze von 8 nicht überschreiten darf Jedes Produktkonzept wird für sich 
anhand einer Kaufwahrscheinlichkeit von 0% bis 100% bewertet, wobei zunächst 
das für die Testperson unattraktivste und anschließend das gemäß ihrer bisheri- 
gen Antworten attraktivste Produktkonzept zu bewerten ist. Alle weiteren Stimuli 



Vgl. Green/Srinivasan (1990), S. 1 1; Louviere/Gaeth (1988), S. 63. Reiners (1996), S. 93 
und Srinivasan/Park (1997), S. 286. 

Vgl. Green/Krieger/Agarwal (1991), S. 220. 
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des Validation-Sets sind dann innerhalb dieser Bandbreiten zu bewerten, konsi- 
stentes Antwortverhalten vorausgesetzt.^^^ 

Das Zielkriterium für die Kombination der beiden Teilnutzenwerte ist, entspre- 
chend dem Vorgehen bei der CCC und der CHIC, die Antworten hinsichtlich des 
Validation-Sets bestmöglich prognostizieren zu können. Die optimale Gewich- 
tung der Teilnutzenwerte aus der Self-Explicated-Phase und der Paarvergleichs- 
aufgabe wird bei der ACA mittels individueller OLS-Schätzung ermittelt. Als 
abhängige Variable geht dabei der Logit der Kaufwahrscheinlichkeit für die Pro- 
duktbeschreibungen des Validation-Sets in das Modell ein^^^: 



(3-5) ln[KWj/(l-KWj)]«ai 



■bilPj 

jeJ 



Pairs 



ijkj 



+ C 



jeJ 



(iEl;kGKj) 



wobei: 

KWj! Prognostizierte Kaufwahrscheinlichkeit für ein Produkt im 
Validation-Set durch den i-ten Probanden, 

aj: Konstantes Glied der Schätzgleichung für den i-ten Proban- 

den, 

bj! zu schätzender Regressionskoeffizient für die Gewichtung 

der Teilnutzenwerte aus der Paarvergleichsaufgabe für den i- 
ten Probanden, 

Ci! zu schätzender Regressionskoeffizient für die Gewichtung 

der Teilnutzen werte aus der Self-Explicated-Phase für den i- 
ten Probanden,^^^ 

Aktualisierter Teilnutzen nach dem letzten Paarvergleich der 

Pjjkj • k-ten Ausprägung bei der j-ten Eigenschaft für den i-ten Pro- 
banden, 

pSE Self-Explicated-Teilnutzen der k-ten Ausprägung bei 
■ der j-ten Eigenschaft für den i-ten Probanden. 



Zur Gestaltung des Kalibrierungssets vgl. auch Reiners (1996), S. 120. 

Zur Modellbeschreibung der Kombinationsphase vgl. Metegrano (1994), S. H-2. 

Alternativ bietet die ACA 4.0 dem Anwender die Wahl, daß die Teilnutzenwerte aus den 
Paarvergleichen und der Self-Explicated-Phase gleichgewichtet aufsummiert werden. In 
diesem vereinfachten Fall wird nur ein Regressionskoeffizient für beide Teilnutzenwerte 
geschätzt. Formal gilt in diesem Fall bj = Cj . 
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Die Regressionskoeffizienten bj und Cj entsprechen inhaltlich den Gewichtungs- 
faktoren Wi* und (1-Wi*) bei der CCC und CHIC. Der Unterschied besteht in der 
jeweiligen Ermittlung dieser Gewichtungsfaktoren. Während die Werte bei der 
ACA auf Basis einer individuellen OLS-Schätzung bestimmt werden, basiert die 
optimale Gewichtung bei der CCC und CHIC auf einer optimalen Kreuzvalidie- 
rung zwischen beobachteten und prognostizierten Präferenzen hinsichtlich des 
Validation-Sets, gemessen durch entsprechende Korrelationskoeffizienten.^^^ 

Damit unterscheidet sich auch die Kombinationsphase der ACA in zwei wesentli- 
chen Merkmalen von den beiden neuen Methoden. Aus Sicht der Datenerhebung 
wird deutlich, daß die Beurteilungsaufgabe für den Probanden in der Kombinati- 
onsphase eine andere ist als in der Conjoint-Aufgabe. Während dort Paarverglei- 
che, beschrieben durch 2 bis 3 Eigenschaften, vorgelegt werden, umfaßt das Va- 
lidation-Set nahezu Vollprofile, die alle separat zu bewerten sind. Im Gegensatz 
dazu ist die Beurteilungsaufgabe im Validation-Set bei der CCC und der CHIC 
jeweils identisch mit der Abfrage in der eigentlichen Conjoint-Aufgabe. Der 
zweite Unterschied betrifft die optimale Kombination der Teilnutzenwerte aus 
beiden Datenerhebungsphasen. Während bei der CCC und CHIC die optimalen 
Gewichtungsfaktoren durch Maximierung der Korrelationskoeffizienten zwi- 
schen beobachteten und prognostizierten Präferenzen ermittelt werden, schätzt 
die ACA diese Werte mittels individueller OLS-Schätzung. 

Die Struktur insbesondere der Datenerhebung der ACA wird im folgenden Ab- 
laufschema (vgl. Abbildung 3-5) zusammenfassend dargestellt. 



Zur Schätzung der Teilnutzenwerte bei der ACA vgl. Sawtooth Software (1996), S. 16 ff 
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Abbildung 3-5: Interviewablauf der ACA 
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Quelle: Eigene Erstellung 



Nachdem die 3 computergestützten hybriden Verfahren CCC, CHIC und ACA 
separat dargestellt wurden, faßt die folgende Abbildung 3-6 alle wesentlichen 
Merkmale und Unterschiede der 3 Methoden noch einmal zusammen. Schwer- 
punkt der Gegenüberstellung sind die Unterschiede in der Datenerhebung als 
auch in der Schätzung der Teilnutzenwerte der Self-Explicated- und der Con- 
joint-Phase sowie deren Kombination. Die Übersicht ist entsprechend der 3 Pha- 
sen (Self-Explicated-, Conjoint- und Kombinationsphase) unterteilt. 
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Abbildung 3-6: Merkmale der untersuchten computergestützten hybriden Verfah- 
ren im Vergleich (Teil 1) 
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joint-Phase 


•zwischen Self- 
Explicated-Phase und 
Conjoint-Phase und 
innerhalb der Paarver- 
gleichsaufgabe 


Schätzung der 
Teilnutzenwerte 


•einmalige Schätzung 
mittels LINMAP auf 
Basis der Rangdaten 
bzw. mittels OLS- 
Schätzung auf Basis 
der Rating-Daten 


•einmalige Schätzung 
mittels OLS auf Basis 
der metrisch skalierten 
Präferenzdaten 


• schrittweise Aktuali- 
sierung der Ausgangs- 
schätzung nach jedem 
Paarvergleich 
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Abbildung 3-6: Merkmale der untersuchten computergestützten hybriden Verfah- 
ren im Vergleich (Teil 2) 



Merkmal 


CCC 


CHIC 


ACA 


Kombinationsphase | 


Größe des 
Validation-Sets 


• 3 bis 12 Produkte 


•je nach Größe der 
Choice-Sets 4 bis 6 


•4 bis 8 


Beurteilung des 
Validation-Sets 


• identisch mit Conjoint-Phase 


•Abfrage der Kauf- 
wahrscheinlichkeit 
von 0% bis 100% für 
ganzheitlich beschrie- 
bene Produkte 


Ermittlung der 
optimalen Ge- 
wichtungsfakto- 
ren 


•Gemessen durch maximale Korrelation zwi- 
schen beobachteter und prognostizierter Präfe- 
renzen für das Validation-Set 


• Individuelle OLS- 
Schätzung mit Ge- 
wichtungsfaktoren als 
Regressionskoeffizi- 
enten 



Quelle: Eigene Erstellung 



Faßt man die Hauptunterschiede zwischen den Verfahren zusammen, werden im 
wesentlichen folgende zwei Punkte deutlich. Mit der CCC und der CHIC werden 
zwei neue computergestützte hybride Verfahren vorgestellt, bei denen jeweils 
mehr als 2 Stimuli in der Conjoint-Phase des Interviews simultan zu bewerten 
sind. Damit wird der Bereich computergestützter hybrider Verfahren um neue 
Methoden erweitert, bei denen alternative dekompositioneile Ansätze berück- 
sichtigt werden. Eine vergleichende Validitätsprüfung bietet dann die Möglich- 
keit zu testen, ob das relativ schlechte Abschneiden der ACA in bisherigen empi- 
rischen Untersuchungen u.a. in der häufig kritisierten Konzeption der Paarver- 
gleichsaufgabe begründet liegt. 



Der zweite wesentliche Unterschied zwischen den Verfahren betrifft das Ausmaß 
der Individualisierung der einzelnen Verfahren. Auch wenn alle 3 vorgestellten 
Verfahren einen adaptiven Charakter aufweisen, variiert dabei das Ausmaß, in 
dem nachfolgende Befragungsschritte an bereits gewonnene Informationen ange- 
paßt werden. So findet sowohl bei der CCC als auch der CHIC eine einmalige 
Anpassung zwischen der Self-Explicated- und der Conjoint-Phase statt. Bei der 
ACA dagegen werden darüber hinaus auch innerhalb der Conjoint-Phase die ein- 
zelnen Paarvergleiche in Abhängigkeit bereits erhobener Präferenzurteile konzi- 
piert. Gleichzeitig findet hierbei eine kontinuierliche Schätzung der Teilnutzen- 
werte innerhalb des Conjoint-Interviews statt. Die Conjoint-Teilnutzenwerte der 



107 





CCC und der CHIC werden im Gegensatz hierzu durch eine einmalige Schätzung 
bestimmt, bei der alle im Rahmen der Conjoint-Phase erhobenen Präferenzdaten 
gemeinsam ausgewertet werden. Die Verfahren weichen somit neben der unter- 
schiedlichen Gestaltung der Conjoint-Phase dahingehend voneinander ab, inwie- 
weit diese individualisiert und an vorangegangene Antworten angepaßt wird. Ob 
und in welcher Form sich diese Unterschiede auf die Validität der Ergebnisse 
auswirken, muß empirisch überprüft werden. Im Rahmen der vorliegenden Arbeit 
wurde aus diesem Grund eine vergleichende Studie durchgefuhrt, deren Untersu- 
chungsdesign im nächsten Kapitel beschrieben wird. 
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4 Untersuchungsdesign 

Als zweites Ziel der vorliegenden Arbeit sollen die neu entwickelten Methoden 
einer empirischen Validitätsprüfung unterzogen werden. Zunächst wird in diesem 
Kapitel das Untersuchungsdesign der hierzu durchgefiihrten empirischen Studie 
beschrieben. Neben der Darstellung des Untersuchungsgegenstands wird die Zu- 
sammensetzung der Gesamtstichprobe dokumentiert und die Teilstichproben auf 
strukturelle Vergleichbarkeit getestet. Im dritten Abschnitt des Kapitels werden 
der Interviewablauf der Befragung und die Aufbereitung der Daten kurz skizziert. 

4.1 Untersuchungsobjekt 

Gegenstand der empirischen Untersuchung sollte ein Produkt sein, das von einer 
großen Anzahl potentieller Nachfrager beurteilt werden kann. Vor diesem Hin- 
tergrund wurden Kühlschränke als Untersuchungsgegenstand gewählt. Das Pro- 
dukt „Kühlschrank“ stellt einen sehr weit verbreiteten Gebrauchsgegenstand dar, 
dessen Eigenschaften größtenteils auch von bisherigen Nichtkäufem beurteilt 
werden können. Aufgrund hoher Bekanntheit und relativ hohem Involvement 
beim Kauf des Produkts kann davon ausgegangen werden, daß die Bewertungen 
der verschiedenen Eigenschaften bzw. deren Ausprägungen nicht willkürlich ge- 
troffen werden. Gleichzeitig handelt es sich bei Kühlschränken um ein Pro- 
dukt, bei dem eine größere Anzahl an Eigenschaften für die Kaufentscheidung 
relevant ist. Auch dies war entscheidend für die Produktwahl, da die getesteten 
Methoden gerade für solche Fragestellungen Vorteile aufweisen. Darüber hinaus 
wurden bereits in anderen Studien „Kühlschränke“ als Beispiel herangezogen. So 
unter anderem in einem sehr umfassenden Vergleich alternativer Präferenzmeß- 
methoden von Huber et al. (1993).^^® Die Wahl des gleichen Produkts erhöht so- 
mit die prinzipielle Vergleichbarkeit der Untersuchungsergebnisse. 

Aufgrund zahlreicher unterschiedlicher Modelle und Typen innerhalb der Pro- 
duktklasse „Kühlschrank“, wurde für die empirische Untersuchung eine Ein- 
schränkung auf sogenannte Tischmodelle (Maße: 80cm/60cm/60cm) mit Gefrier- 
fach vorgenommen. Dies war notwendig, um bei systematischer Variation der 

Vgl. hierzu auch Hahn (1997), S, 161. 

Vgl. Huber et al.( 1993), S. 107. 
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Eigenschaflsausprägungen insgesamt realistische und vergleichbare Eigen- 
schaftskombinationen zu erhalten. Auf Basis von Produktbeschreibungen der 
Hersteller sowie in Anlehnung an bisher veröffentlichte Studien mit Kühlschrän- 
ken als Untersuchungsgegenstand wurden zunächst 13 Eigenschaften mit 2 bis 4 
Ausprägungen betrachtet. Im Rahmen einer schriftlichen Befragung von 32 Aus- 
kunftspersonen sind die Wichtigkeiten dieser 13 Eigenschaften anhand einer 7- 
Punkte-Rating-Skala (1 = “vollkommen unwichtig“; 7 = “sehr wichtig“) erfragt 
worden. Nach diesem Pretest konnte eine Reduzierung der Merkmale vorge- 
nommen werden. Für die Auswahl einer Eigenschaft war entscheidend, daß sich 
über alle Auskunftspersonen ein Mittelwert der Wichtigkeitsurteile > 4 ergab.^^’ 
Das Ergebnis des Pretests zeigte, daß genau 8 der 13 Eigenschaften diese Bedin- 
gung erfüllten. Die Zusammenstellung der Eigenschaftsausprägungen erfolgte 
unter dem Gesichtspunkt, für das betrachtete Preissegment möglichst realistische 
Kombinationen aller anderen Eigenschaften vornehmen und die real am Markt 
existierenden Modelle abbilden zu können. Die untersuchten 8 Eigenschaften und 
ihre Ausprägungen sind in Tabelle 4-1 wiedergegeben.^^^ 



Der Wert 4 bildet die Mitte der angewendeten 7-Punkte-Rating-Skala mit den Extrempolen 
1 = „vollkommen unwichtig“ und 7 = „sehr wichtig“. Ein Mittelwert >4 impliziert dem- 
nach, daß für die Mehrheit der Auskunftspersonen die entsprechende Eigenschaft eher 
wichtig als unwichtig ist. 

Die fünf Eigenschaften, die sich im Rahmen des Pretests als weniger wichtig erwiesen, 
waren: „Temperaturanzeige“, „Lagerzeit bei Stromausfall“, „Super-Frost-Funktion“, „Ma- 
terial der Abstellflächen“ und „Automatische Türschließung“. 



110 




Tabelle 4- 1 : Untersuchte Eigenschaften und deren Ausprägungen 



Eigenschaft 


Ausprägungen 


Marke 


• Liebherr 

• Siemens 

• Electrolux 

• Quelle Privileg 


Preis 


• 449,.. dm 

• 549,- DM 

• 649,- DM 


Energieverbrauch 
pro Jahr 
(Energie) 


• 150 kWh pro Jahr 

• 200 kWh pro Jahr 

• 250 kWh pro Jahr 


Garantiedauer 

(Garantie) 


• 12 Monate 

• 1 8 Monate 

• 24 Monate 


Nutzinhalt 

(Inhalt) 


• 115 Liter 

• 130 Liter 

• 145 Liter 


Innenausstattung 

(Innen) 


• Innenaufteilung vorgegeben 

• Kühlteil variabel 

• Kühlteil und Tür variabel 


Abtaumöglichkeit 

(Abtau) 


• von Hand 

• Abtau-Automatik im Kühlteil 


Sterne des Gefrierfachs 
(Gefrier) 


• *-Fach (-6° C) 

• ***-Fach(-18°C) 



' yrr 

Quelle: Eigene Erstellung 



Die nicht berücksichtigten Eigenschaften wurden für alle zu bewertenden Pro- 
duktbeschreibungen konstant gehalten und die Testpersonen in den einzelnen 
Phasen des Interviews auf diese Tatsache aufmerksam gemacht. 

4.2 Stichprobe 

Die empirische Überprüfung der Methoden basiert auf einer jeweils unabhängi- 
gen Stichprobe potentieller Nachfrager für Kühlschränke für die ACA, CCC und 
CHIC (between-subject-design). Durch Auswahl einer separaten Stichprobe für 
die einzelnen hybriden Methoden wird vermieden, daß die Ergebnisse durch Rei- 



Es sei daraufhingewiesen, daß alle Tabellen und Abbildungen, die sich auf die Ergebnisse 
der vorliegenden Untersuchung beziehen, von der Autorin erstellt wurden. Auf eine wie- 
derholte Kennzeichnung wird im folgenden verzichtet. 
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henfolge- und/oder Lerneffekte bei den Probanden beeinflußt werden.^^"^ Außer- 
dem kann so eine Überforderung der Auskunftsbereitschaft der Probanden ver- 
mieden werden.^^^ Die Auswahl der Personen für die Befragung erfolgte nach 
dem Quotenverfahren, wobei „Alter“ und „Geschlecht“ als Quotenmerkmale 
dienten. Die Ausprägungen der Quotenmerkmale wurden entsprechend des Bun- 
desdurchschnitts der Gesamtbevölkerung festgelegt. Zudem wurden nur diejeni- 
gen Personen befragt, die sich prinzipiell vorstellen konnten, in den nächsten 12 
Monaten einen Tischkühlschrank zu kaufen.^^^ Mit dieser zusätzlichen Eingren- 
zung des Personenkreises soll sichergestellt werden, daß die Probanden zur Ziel- 
gruppe für diese Größe und Art von Kühlschränken zählen. Einschränkend muß 
an dieser Stelle angemerkt werden, daß die gewählte Stichprobe nur näherungs- 
weise als repräsentativ für die betrachtete Zielgruppe angesehen werden darf. 
Zum einen wurden lediglich zwei Quotenmerkmale zur Auswahl der Probanden 
herangezogen und zum anderen kann nicht uneingeschränkt davon ausgegangen 
werden, daß deren Ausprägungen gemäß dem Bundesdurchschnitt den potentiel- 
len Nachfragern für Tischkühlschränke entsprechen. 

Die Gesamtstichprobe umfaßte insgesamt 748 Personen und stellt damit eine der 
bisher umfassendsten wissenschaftlichen Studien hinsichtlich eines Methoden- 
vergleichs dar.^^^ Alle Interviews wurden im Juni 1998 von dem Marktfor- 
schungsinstitut IPSOS Deutschland durchgeführt.^^^ Es handelte sich dabei um 
Studio-Interviews in den Städten Hamburg, Frankfurt/Main und München. In 
jeder Stadt wurden alle drei Methoden CCC, CHIC und ACA gleich häufig ein- 
gesetzt. Von der Gesamtzahl durchgeführter Interviews konnten letztendlich nur 
die in die Analyse einbezogen werden, die vollständig beantwortet bzw. auszu- 
werten waren. Nicht vollständig beantwortet wurden 23 (ACA:1; CCC: 8; CHIC: 
14) Interviews, so daß der empirische Validitätsvergleich auf insgesamt 725 
(ACA: 249: CCC: 242; CHIC: 234) ausgewerteten Interviews basiert. Einen Über- 



Vgl. Agarwal/Green (1991), S. 145; Huber et al. (1993), S. 1 10; Johnson (1991), S. 223. 
Vgl. Sattler (1994), S. 34. 

Um zu verdeutlichen, um welche Art von Kühlschränken es sich bei der Kategorie „Tisch- 
kühlschränke“ handelt, wurden den Personen Fotos verschiedener Modelle vorgelegt. 

Vgl. hierzu die Stichproben bisheriger Vergleichsstudien in Kapitel 2. 

An dieser Stelle sei der IPSOS Deutschland, namentlich Herrn Harald Hasselmann und 
Frau Claudia Keck für die Durchführung der Datenerhebung und die außerordentlich gute 
Zusammenarbeit gedankt. 
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blick über den Umfang und die demografische Struktur der drei Teilstichproben 
gibt nachstehende Tabelle. Sofern einzelne Probanden keine Angabe zu den er- 
hobenen demografischen Merkmalen gemacht haben, werden diese als „missing 
values“ aufgefuhrt. 



Tabelle 4-2: Umfang und demografische Struktur der Teilstichproben 



Methode 


ACA 


ccc 


CHIC 




absolut 


in% 


absolut 


in% 


absolut 


in % 


Demografische 


n=249 


n=100% 


n=242 


n=100% 


n=234 


n=100% 


Merkmale 














Geschlecht: 














männlich: 


122 


49 


114 


47 


118 


50 


weiblich: 


127 


51 


127 


53 


116 


50 


missing values 


- 


- 


1 


0 


- 


- 


Alter: 














18-29 Jahre 


54 


22 


54 


22 


54 


23 


30-39 Jahre 


65 


26 


66 


27 


73 


31 


40-49 Jahre 


42 


17 


38 


16 


24 


10 


50-70 Jahre 


88 


35 


84 


35 


83 


35 


Bildung: 














Hauptschule 


9 


4 


4 


2 


4 


2 


Hauptschule mit 


37 


15 


32 


13 


46 


20 


Berufsausbildung 














mittlere Reife 


92 


37 


88 


36 


78 


33 


Abitur 


73 


29 


63 


26 


63 


27 


Universität 


38 


15 


53 


22 


40 


17 


missing values: 


- 


- 


2 


1 


3 


1 


Haushaltsnetto- 














einkommen: 














bis 1.999,- DM 


81 


33 


37 


15 


39 


17 


2.000-2.999,- DM 


48 


19 


47 


19 


48 


21 


3.000-3.999,- DM 


13 


5 


37 


15 


36 


15 


4.000-4.999,- DM 


39 


16 


30 


12 


32 


14 


> 5.000,- DM 


41 


16 


53 


22 


53 


23 


missing values 


27 


11 


34 


14 


25 


11 


Haushaltsgröße: 














1 Person 


99 


40 


90 


37 


86 


37 


2 Personen 


77 


31 


82 


34 


89 


38 


3 Personen 


33 


13 


31 


13 


24 


10 


4 Personen 


27 


11 


26 


11 


29 


12 


5 und mehr Personen 


13 


5 


13 


5 


6 


3 



Datenquelle: IPSOS Deutschland (1998) 



Voraussetzung für einen Vergleich der Ergebnisse zwischen den einzelnen Me- 
thoden, die auf unterschiedlichen Teilstichproben basieren, ist die Vergleichbar- 
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keit dieser Stichproben. Nur wenn diese gegeben ist, kann ausgeschlossen wer- 
den, daß differierende Ergebnisse lediglich auf unterschiedliche Charakteristika 
der Stichproben zurückgefuhrt werden können bzw. müssen. Zur Überprüfung 
der Strukturgleichheit der drei Sample wurde jeweils paarweise zwischen den 
Methoden ein x^-HomogenitätstesP^ im Hinblick auf die sozio-demografischen 
Merkmale Alter, Geschlecht, Bildungsabschluß, Haushaltsnettoeinkommen und 
Haushaltsgröße durchgeführt. Da die beiden Merkmale Alter und Geschlecht als 
Quotenmerkmale herangezogen wurden, war die Vergleichbarkeit der Stichpro- 
ben hinsichtlich dieser beiden Merkmale zu erwarten.^"^® Die Informationen zu 
den drei anderen Merkmalen wurden erst am Ende des Interviews erhoben und 
die Teilstichproben nachträglich auf Vergleichbarkeit hinsichtlich dieser Merk- 
male überprüft. Die Ergebnisse des Homogenitätstests sind in Tabelle 4-3 zu- 
sammengefaßt. In den Spalten stehen die Ergebnisse der verschiedenen Paarver- 
gleiche zwischen den jeweiligen Teilstichproben für das ACA, CCC und CHIC- 
Ver fahren. 



Tabelle 4-3: Testergebnisse der Überprüfung der Teilstichproben 



auf Strukturgleichheit # 



Merkmal 


ACA VS. CCC 


ACA VS. CHIC 


CCC VS. CHIC 


Geschlecht 


n.s. 


n.s. 


n.s. 


Alter 


n.s. 


n.s. 


n.s. 


Bildung 


n.s. 


n.s. 


n.s. 


Einkommen 


29 94 *** 


27 29 *** 


n.s. 


Haushaltsgröße 


n.s. 


n.s. 


n.s. 



# Prüfung anhand paarweiser x^-Homogenitätstests. Bei signifikanten (p<0,10) Unter- 
schieden werden sowohl der x^-Wert als auch das Signifikanzniveau ausgewiesen, 
n.s.: nicht signifikant (p>0,10); * p < 0,10; ** p < 0,05; *** p < 0,0) 



Als Ergebnis der durchgeführten x^-Tests zeigt sich, daß auch bei einer Irrtums- 
wahrscheinlichkeit von p>0,10 die Nullhypothese der Strukturgleichheit in 13 der 
15 durchgefuhrten Vergleiche nicht abgelehnt werden kann. Einzige Ausnahme 
bildet das Merkmal Einkommen. Hinsichtlich dieses Merkmals weicht die Stich- 



Zum x^-Homogenitätstest bei kategorialen Daten vgl. Falk/Becker/Marohn ( 1 995), S. 1 37 ff 
Die aufgetretenen (geringen) Abweichungen zwischen den drei Teilstichproben hinsicht- 
lich dieser beiden Merkmale ergaben sich dadurch, daß unvollständige Interviews aus der 
Analyse ausgeschlossen werden mußten. 
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probe für die ACA signifikant von den beiden anderen Teilstichproben ab. Diese 
Abweichung ist hauptsächlich auf die vergleichsweise große Anzahl befragter 
Personen der untersten Einkommenskategorie im Sample der ACA zurückzufüh- 
ren (vgl. hierzu Tabelle 4-2). Eine genauere Analyse dieser demografischen Va- 
riable ergab jedoch, daß sie keinen signifikanten Einfluß auf die Validität der Er- 
gebnisse ausübt.^"^’ Insgesamt kann somit strukturelle Vergleichbarkeit zwischen 
den unabhängigen Teilstichproben vermutet werden. 

4.3 Interviewablauf 

Während in Kapitel 3 die untersuchten Verfahren konzeptionell dargestellt wur- 
den, ist das Ziel der folgenden Ausführungen, den Interviewablauf und die Da- 
tenauswertung der vorliegenden empirischen Anwendung zu dokumentieren. Da- 
bei werden die einzelnen Verfahrensschritte nicht noch einmal ausführlich erläu- 
tert (vgl. hierzu Kapitel 3), sondern die Besonderheiten bei der konkreten Umset- 
zung der einzelnen Befragungsschritte beschrieben. Die Erläuterungen orientie- 
ren sich an der bereits in Kapitel 3 vorgenommenen Strukturierung des Inter- 
views in Self-Explicated-, Conjoint- und Kombinationsphase. 

4.3.1 Self-Explicated-Phase 

In der Self-Explicated-Phase aller 3 Verfahren beurteilten die Probanden zu- 
nächst die 8 Eigenschaften aus Tabelle 4-1 entsprechend der in Kapitel 3 erläu- 
terten Vorgehensweise.^"^^ Bei den quantitativen Eigenschaften Preis, Energiever- 
brauch, Garantieleistung und Nutzinhalt wurde für die Bewertung der Ausprä- 
gungen bereits eine a priori Ordnung vorgenommen. Beispielsweise gilt, daß bei 
angenommener Konstanz aller anderen Eigenschaften der niedrigste (höchste) 
Energieverbrauch als beste (schlechteste) Ausprägung für alle Probanden festge- 
legt wurde. Die Integration solcher a priori Informationen erhöht nicht nur die 
Effizienz der Datenerhebung, sondern hilft, Schätzfehler zu vermeiden und folg- 
lich die Validität der Ergebnisse zu verbessern.^"^^ Entsprechend entfielen bei der 
CCC und CHIC die Abfrage nach Jeweils bester und schlechtester Ausprägung 

Vgl. Sattler/Hensel-Börner/Krüger (2000), S. 10. Des weiteren sei angemerkt, daß auf- 
grund einer relativ hohen Anzahl an missing values, die Aussagekraft dieser Variable für 
das Gesamtsample eingeschränkt ist. 

Die Abfrage inakzeptabler Eigenschaftsausprägungen wurde in der vorliegenden Pro- 
grammversion der CCC und der CHIC noch nicht implementiert. Aus Gründen der Ver- 
gleichbarkeit wurde auch bei der ACA auf diesen Befragungsschritt verzichtet. 

Vgl. Srinivasan/Jain/Malhotra (1983), S. 434. 
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für diese Eigenschaften. Die Probanden hatten lediglich die mittleren Ausprägun- 
gen auf einer 11 -stufigen Rating-Skala zu bewerten, an deren Endpole die beste 
und schlechteste Ausprägung als Ankerpunkte fungierten. Für die ACA bedeutet 
eine solche a priori Definition von Eigenschaftsausprägungen, daß die Bewertung 
für alle Ausprägungen dieser Eigenschaft entfällt. Die Ausprägungen der verblei- 
benden qualitativen Eigenschaften wurden bei der ACA anhand einer 9-Punkte- 
Skala beurteilt.^'^'^ Im nächsten Befragungsschritt wird jeweils die gleiche 11- 
bzw. 9-Punkte-Skala verwendet, um die Wichtigkeiten der Eigenschaften zu er- 
fassen. Hierfür wurden die Eigenschaften immer mit der individuell besten und 
schlechtesten Ausprägung auf dem Bildschirm präsentiert. Bei der CCC und 
CHIC bestand die Aufgabe der Probanden darin, alle 8 Eigenschaften simultan 
und unter Verwendung der individuell wichtigsten Eigenschaft als Ankerpunkt zu 
bewerten. Im Gegensatz dazu wurden die Eigenschaften bei der ACA jeweils 
einzeln präsentiert und damit separat voneinander beurteilt.^'^^ Unter Annahme 
eines additiven Nutzenmodells wurden für alle drei Verfahren in gleicher Form 
die Self-Explicated-Teilnutzenwerte ermittelt. Diese isolierte Betrachtung der 
ersten Phase ist Grundlage des Methodenvergleichs zwischen den hybriden Ver- 
fahren mit den einfacheren Self-Explicated-Methoden. Im folgenden werden die 
Ergebnisse der Self-Explicated-Verfahren mit SE-CCC, SE-CHIC und SE-ACA 
ausgewiesen. 

4.3.2 Conjoint-Phase 

CCC 

Der dekompositioneile Teil der CCC umfaßte die Beurteilung von 9 verschiede- 
nen Kühlschränken, die anhand der individuell wichtigsten 4 Eigenschaften be- 
schrieben wurden. Während die Anzahl von 4 Kerneigenschaften entsprechend 
der Studie von Srinivasan/Park (1997) festgelegt wurde,^'^^ stellen 9 Stimuli einen 
Kompromiß zwischen ausreichender Anzahl an Beobachtungen und einer auf 
dem Bildschirm darstellbaren Obergrenze an Produktprofilen dar. Die Ausprä- 
gungen dieser Kemeigenschaften wurden systematisch zwischen den Produkten 



Für die ACA ist dies die größtmögliche Anzahl an Skalenpunkten für eine Rating-Skala 
(vgl. Metegrano (1994), S. 3-31). Diese wurde gewählt, um die bestmögliche Vergleich- 
barkeit zur 1 1-Punkte-Rating-Skala der SE-CCC und SE-CHIC zu erzielen. 

Zu den Problemen dieser separaten Abfrage der Wichtigkeiten vgl. Reiners (1996), S. 118. 
Vgl. Srinivasan/Park (1997), S. 288. 
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gemäß eines orthogonalen Untersuchungsdesigns variiert.^"^^ Die Beurteilungs- 
aufgabe der Probanden bestand aus zwei Teilschritten. Zunächst waren die 9 auf 
dem Bildschirm dargestellten Kühlschränke in die Rangfolge zu bringen, in der 
die Probanden die Modelle am ehesten kaufen würden. Entsprechend der angege- 
benen Rangfolge sortierte das Programm die Kühlschränke anschließend auf dem 
Bildschirm. Im zweiten Teilschritt sollte für jeden Kühlschrank eine Kaufwahr- 
scheinlichkeit von 0% bis 100% angegeben werden. Während Rangplätze nicht 
doppelt vergeben werden konnten, war die Angabe gleicher Kaufwahrscheinlich- 
keiten für verschiedene Produkte grundsätzlich möglich. Sichergestellt war aber, 
daß einem Kühlschrank mit einem höherem Rang keine höhere Kaufwahrschein- 
lichkeit zugeordnet werden konnte.^"^^ Die Teilnutzenwerte wurden auf Basis der 
Ranking-Daten mit ordinalem Skalenniveau mit LINMAP von Bretton-Clark und 
unter Verwendung der Kaufwahrscheinlichkeiten mit metrischem Skalenniveau 
mittels OLS-Schätzung geschätzt. Um die Anzahl zu schätzender Parameter so 
gering wie möglich zu halten, wurden bei beiden Schätz verfahren für alle quan- 
titativen Eigenschaften Vektor- und nur für die qualitativen Eigenschaften Teil- 
nutzenmodelle unterstellt. Das Verfahren LINMAP ermöglicht hierbei, a priori 
Ordnungen für Eigenschaftsausprägungen bei der Schätzung zu berücksichtigen. 
Die bereits im Self-Explicated-Teil erhobenen Präferenzen hinsichtlich der Ei- 
genschaftsausprägungen wurden daher bei der Schätzung der Teilnutzenwerte mit 
LINMAP als Nebenbedingung für das Optimierungsverfahren integriert.^^® Um 
die ermittelten Conjoint-Teilnutzenwerte für die Kerneigenschaften mit den Er- 
gebnissen der Self-Explicated-Phase vergleichen zu können, war eine Umskalie- 
rung der Conjoint-Ergebnisse in der Weise notwendig, daß die Summe der Be- 



Zu orthogonalen Designplänen vgl. Addelman (1962), S. 34 ff. 

Auf dem Bildschirm erschien in diesem Fall eine entsprechende Fehlermeldung mit der 
Bitte an den Probanden, seine Eingabe zu korrigieren. 
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Das Verfahren LINMAP ermöglicht grundsätzlich zwar auch die Auswertung von Rating- 
Daten, verwendet für die Schätzung der Teilnutzenwerte jedoch lediglich die ordinalen In- 
formationen hinsichtlich der erhobenen Präferenzen (vgl. Bretton-Clark (1989), S. 50). Die 
durch den zweiten Teilschritt zusätzlich erhobenen Informationen fänden daher keine Be- 
rücksichtigung in der Schätzung. Demzufolge würde eine Auswertung der Kaufwahr- 
scheinlichkeitsdaten mit diesem Verfahren zu den gleichen Ergebnissen wie auf Basis der 
Rangdaten führen. Abweichungen konnten nur bei den Probanden auftreten, die die glei- 
chen Kaufwahrscheinlichkeiten mehrfach vergeben haben. 

Van der Lans/Heiser (1992) zeigen empirisch, daß die Integration solcher „constraints“ bei 
der Schätzung der Conjoint-Teilnutzenwerte die Schätzergebnisse, gemessen im Rahmen 
einer Kreuzvalidierung, verbessert werden können. Die Verbesserungen fallen zwar klein 
aus, sind aber statistisch signifikant (vgl. van der Lans/Heiser (1992), S. 336). 
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deutungsgewichte für die vier Kerneigenschaften gleich der entsprechenden 
Summe der Self-Explicated-Ergebnisse entsprach.^^' 

CHIC 

Für die CHIC bestand die Aufgabe der Conjoint-Phase in der Bewertung ver- 
schiedener Choice-Sets. Die Anzahl insgesamt zu beurteilender Choice-Sets hing 
dabei von den individuellen Kerneigenschaften ab. Analog zur CCC wurden die 
Produktkonzepte anhand der 4 individuell wichtigsten Eigenschaften beschrie- 
ben. Zählten beide Eigenschaften mit nur 2 Ausprägungen (Abtaumöglichkeit 
und Sterne des Gefrierfachs) zu den Kerneigenschaften, waren in der Conjoint- 
Phase 2, andernfalls 3 Choice-Sets zu bewerten. Ein Choice-Set bestand aus je- 
weils 4 Produktalternativen und der Nicht-Kauf-Alternative. Wie in Kapitel 3.2 
dargestellt, stand bei der Konstruktion dieser Choice-Sets das Prinzip der Pareto- 
Optimalität im Vordergrund.^^^ Hierfür wählte das Programm aus dem jeweils 
vollständigen Design zunächst alle diejenigen Eigenschaftskombinationen aus, 
die sich in mindestens 2 Eigenschaften unterschieden. Damit reduzierte sich die 
Zahl zu bewertender Stimuli bereits erheblich, denn je nach individuellen Kern- 
eigenschaften und dem daraus entstehenden vollständigen Design aus 81 
(3*3*3*3), 54 (3*3*3*2) oder 36 (3*3*2*2) Eigenschaftskombinationen, erfüll- 
ten nur noch 22, 14 oder 10 Produktbeschreibungen diese Nebenbedingung.^^^ 
Die anschließende Aufteilung der Stimuli auf die verschiedenen Choice-Sets er- 
folgte zufällig, um systematische Verzerrungen zu vermeiden. Folglich variiert 
die Zusammenstellung der Choice-Sets über die Probanden, wodurch das Aus- 
maß der Individualisierung des Interviewablaufs erhöht wird. Nachteilig wirkt 
sich diese zusätzliche Individualisierung allerdings auf den Aufwand der Daten- 
auswertung aus, da noch keine Standardprogramme für die individuelle Auswer- 
tung bei den neuen Methoden vorliegen. 

Die Gestaltung der Beurteilungsaufgabe entsprach der in Kapitel 3. 2.2. 2 erläu- 
terten Vorgehensweise. Durch eine wiederholte Auswahlentscheidung wurden 



Vgl. Srinivasan/Park (1997), S. 288. 

Zu den Eigenschaften eines pareto-optimalen Designs vgl. Kapitel 3.2.2. 1 dieser Arbeit. 

Um die Größe der Choice-Sets konstant halten zu können, wurde bei einem 3 *3*3*2- 
Design (3*3*2*2-Design) der Kerneigenschaften das bereits reduzierte Design von 14(10) 
Stimuli um zwei weitere ergänzt, um 4 (3) gleiche große Choice-Sets bilden zu können. 
Um hierbei systematische Einflüsse zu vermeiden, wurden auch diese beiden Ergänzungs- 
karten jeweils zufällig aus dem vollständigen Design ausgewählt. 
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die Alternativen eines Choice-Sets zunächst in eine Präferenzrangfolge gebracht. 
Die Präferenzunterschiede sollten anschließend anhand einer 100 Punkte-Skala 
bewertet werden, bei der die zuerst (100 Punkte) und zuletzt (0 Punkte) ausge- 
wählten Alternativen die Endpole bildeten. Für den letzten Teilschritt der Beur- 
teilungsaufgabe wurden noch einmal die an erster und an dritter Stelle ausge- 
wählten Produktbeschreibungen präsentiert.^^'^ Die Aufgabe der Probanden war, 
den Präferenzunterschied zwischen diesen beiden Alternativen mit einem DM- 
Betrag zu bewerten. Auf Basis dieser Anwort war es möglich, die Präferenzunter- 
schiede des gesamten Choice-Sets in eine monetäre Größe zu transformieren. Die 
Quantifizierung der Präferenzunterschiede zwischen den Alternativen wurde 
auch erfragt, wenn sich die Probanden zunächst für die Nicht-Kauf-Alternative 
entschieden hatten. Die Bewertung fand dann unter der Annahme statt, daß keine 
anderen Produktalternativen zur Verfügung stehen. 

Um die Präferenzwerte aller Stimuli (über die Choice-Sets hinweg) miteinander 
vergleichen zu können, wurden die einzelnen Choice-Sets über die Zahlungsbe- 
reitschaft für die in jedem Choice-Set am schlechtesten bewertete Produktalter- 
native miteinander verankert.^^^ Die Berechnung der Zahlungsbereitschaft er- 
folgte über die Self-Explicated-Teilnutzenwerte für die Eigenschaft „Preis“.^^^ 
Einen Sonderfall hierbei stellten die Choice-Sets dar, bei denen in der ersten 
Auswahlentscheidung die Nicht-Kauf-Alternative gewählt wurde. In der vorlie- 
genden Untersuchung trat dieser Fall bei 24 von insgesamt 941 bewerteten 
Choice-Sets und damit sehr selten auf Für die überraschend seltene Wahl der 
Nicht-Kauf- Alternative können unterschiedliche Gründe eine Rolle spielen. Zum 
einen kann das Ergebnis bedeuten, daß überwiegend attraktive Produktprofile zur 
Auswahl standen, bei denen nur in den seltensten Fällen alle abzulehnen waren. 



Die Auswahl genau dieser beiden Alternativen ist nicht zwingend erforderlich. Der dritte 
Teil der Beurteilungsaufgabe kann auch für alternative Paare aus dem Choice-Set durchge- 
führt werden. 

Auch hier gilt, daß eine Verankerung über die am schlechtesten bewertete Alternative nicht 
unbedingt erforderlich ist. Eine Verankerung der Choice-Sets kann prinzipiell auch über 
die jeweils am besten bewertete oder eine „mittlere“ Alternative vorgenommen werden. 
Empfohlen wird dennoch eine Verankerung über einen der beiden Eckwerte, d.h. die beste 
oder schlechteste Alternative, denn der vorliegende Datensatz belegt, daß hier die höchste 
Übereinstimmung zwischen den auf Basis der Self-Explicated-Daten ermittelten und im 
Conjoint-Teil beobachteten Präferenzrangfolgen auftrat. 

Zur genauen Vorgehensweise der Transformation der Präferenzwerte in eine metrische 
Gesamtreihenfolge vgl. das Rechenbeispiel in Kapitel 3-:2.2.3. 
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Zum anderen könnten die Probanden bei einer Befragung hinsichtlich ihrer Präfe- 
renzen zwischen verschiedenen Produkten zögern, tatsächlich alle Alternativen 
abzulehnen. Letzteres würde allerdings einen wesentlichen Vorteil aller Choice- 
Experimente in Frage stellen. Ein abschließendes Urteil diesbezüglich ist auf Ba- 
sis der vorliegenden Studie jedoch nicht zulässig. Denn hierbei muß berücksich- 
tigt werden, daß vor allem die zusätzliche Bewertung der Stimuli nach der Ent- 
scheidung für die Nicht-Kauf- Alternative die vorliegenden Ergebnisse verzerrt 
haben kann. Weiterhin ist nicht auszuschließen, daß die aus Platzgründen we- 
sentlich kleinere Darstellung der Nicht-Kauf-Alternative auf dem Bildschirm ge- 
genüber den Produktbeschreibungen dieses Ergebnis beeinflußt haben könnte.^^^ 
Eine genauere Überprüfung der 24 Choice-Sets ergab, daß bei 1 5 dieser Sets auf 
Basis der Self-Explicated-Teilnutzen die niedrigsten Zahlungsbereitschaften für 
die Produktalternativen prognostiziert wurden. Konsistent mit dem geäußerten 
Nicht-Kauf-Interesse wurden sie durch die Verankerung der Choice-Sets über die 
Zahlungsbereitschaften am Ende der Präferenzrangfolge eingeordnet. Widersprü- 
che zwischen geäußerter Nicht-Kauf-Wahl und geschätzter Zahlungsbereitschaft 
zeigten sich in weniger als 1% aller bewerteten Choice-Sets und können deshalb 
vernachlässigt werden. 

Die ermittelte Gesamtpräferenzreihenfolge über alle bewerteten Stimuli bildete 
die abhängige Variable für eine OLS-Schätzung, um die Teilnutzenwerte für 
Kerneigenschaften zu bestimmen.^^^ Als unabhängige Variablen gingen die Ei- 
genschaftsausprägungen in die OLS-Schätzung ein.^^^ Da die Auswahl der Sti- 
muli nicht wie beispielsweise bei der CCC auf einem orthogonalen Design ba- 
sierte, sondern sich am Zielkriterium der Pareto-Optimalität orientierte, mußten 
alle Gesamtdesigns auf Korrelationen zwischen den Eigenschaftsausprägungen 
überprüft werden. Für alle 234 Probanden wurden die paarweisen Korrelationen 



Vgl. hierzu auch den Bildschirmausdruck dieses Befragungsschritts im Anhang 7.2. 

Zur Berechnung der Teil nutzenwerte durch Regressionsanalyse vgl. auch Backhaus et al. 
(1996), S. 551 f 
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Die Schätzung der Teilnutzen werte wurde mit dem Conjoint-Modul in SPSS vorgenom- 
men. Es sei an dieser Stelle darauf hingewiesen, daß SPSS dabei ebenfalls eine a priori- 
Ordnung (entsprechend der „constraints“ beim Verfahren LINMAP) von Ausprägungen 
ermöglicht. Diese werden jedoch nicht in der Schätzung berücksichtigt, sondern lediglich 
im Falle einer Verletzung dieser Ordnung als solche ausgewiesen. Damit werden die Vor- 
teile der Integration entsprechender a priori-Ordnungen bei der OLS-Schätzung nicht ge- 
nutzt. 
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zwischen den Eigenschaftsausprägungen der Kerneigenschaften überprüft. Insge- 
samt ergaben sich 1404 Korrelationskoeffizienten, von denen 1361 (« 97%) in 
ihrem Betrag nicht größer als 0,3 ausfielen.^^® Sie liegen damit deutlich unter dem 
bei Conjoint-Designs üblicherweise angenommenen Grenzwert von 0,5.^^‘ Die 
verbleibenden 3% der paarweisen Korrelationen wiesen mit Werten zwischen 0,4 
und 0,7 deutlich stärkere Abhängigkeiten auf. Aufgrund ihres sehr seltenen Auf- 
tretens muß jedoch nicht angenommen werden, daß das Gesamtergebnis, insbe- 
sondere bei Auswertung der Daten auf aggregierter Ebene, dadurch maßgeblich 
beeinflußt wird. Die Überprüfung der Designs auf Korrelationen zwischen den 
Eigenschaftsausprägungen zeigt demnach, daß insgesamt sehr geringe paarweise 
Korrelationen zwischen den Eigenschaftsausprägungen auftreten, diese aber zu- 
gunsten der Pareto-Optimalität der Designs in Kauf genommen werden können. 
Eine Umskalierung der geschätzten Conjoint-Teilnutzenwerte für die Kemeigen- 
schaften erfolgte entsprechend dem Vorgehen bei der CCC derart, daß die Sum- 
me der Bedeutungsgewichte der Kerneigenschaften gleich der Summe der Self- 
Explicated-Teilnutzenwerte für diese Eigenschaften war. 

ACA 

Für die Gestaltung des gesamten ACA-Interviews wurden die Standardeinstel- 
lungen des Systems übernommen bzw. die Entscheidungen unter dem Gesichts- 
punkt einer bestmöglichen Vergleichbarkeit zu den beiden neuen Verfahren CCC 
und CHIC getroffen. So bildete das System 4.0 der ACA bei gegebener Anzahl 
an Eigenschaften und Ausprägungen 19 Paarvergleiche für die Conjoint-Phase 
der Befragung. Die Produktkonzepte wurden entsprechend der Anwendungsemp- 
fehlung zunächst anhand von 2 und im späteren Interviewverlauf von 3 Eigen- 
schaftsausprägungen charakterisiert.^^^ Auf einer 9-Punkte-Rating-Skala gaben 
die Probanden für jeden Paarvergleich an, welches der beiden Produktkonzepte 



Die Gesamtzahl der paarweisen Korrelationen ergibt sich aus (n(n-l)/2)*234, wobei n für 
die Anzahl der Kerneigenschaften steht. 

Es sei darauf hingewiesen, daß dieser Grenzwert als „Daumenregel“ zu interpretieren ist. 
Eine mögliche empirische Überprüfung des Einflusses der Korrelationen auf die Schätzer- 
gebnisse besteht in einer erneuten Schätzung der Parameter, nachdem eine der beiden kor- 
relierten Variablen ausgeschlossen wurde (vgl. Backhaus et al. (1996), S. 34). Im Rahmen 
einer Conjoint-Analyse ist diese Vorgehensweise jedoch nicht sinnvoll, da damit eine zu 
untersuchende Eigenschaft, die als unabhängige Variable in die Schätzgleichung eingeht, 
aus der Analyse ausgeschlossen werden müßte. 

Vgl. Johnson (1987), S. 261 und Green/Krieger/Agarwal (1991), S. 216. 
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sie präferieren und wie stark.^^^ Nach jedem Paarvergleich aktualisiert die ACA 
die Schätzergebnisse auf Basis der neu gewonnenen Informationen. So liegen 
nach Abschluß der Paarvergleichsaufgabe Teilnutzenwerte vor, die ausgehend 
von den Self-Explicated-Teilnutzenwerten (SE-ACA) schrittweise mit jedem be- 
werteten Paarvergleich aktualisiert wurden. Die Vorgehensweise zur Schätzung 
der Teilnutzenwerte unterscheidet sich infolgedessen maßgeblich von der CCC 
und CHIC, bei denen die Conjoint-Teilnutzenwerte auf einer einmaligen Aus- 
wertung aller erhobenen Präferenzurteile beruhen. In diesem Zusammenhang 
wird noch einmal deutlich, daß die ACA im Gegensatz zu den beiden neuen Ver- 
fahren nicht nur hinsichtlich der Gestaltung nachfolgender Befragungsschritte, 
sondern auch der Schätzung der Teilnutzenwerte adaptiven Charakter aufweist. 

4.3.3 Kombinationsphase 

Bei allen drei Verfahren wurden in der Kombinationsphase zusätzliche Präferenz- 
urteile für ein Kalibrierungsset^^'^ erhoben, um die Informationen aus der Self- 
Explicated-Phase und der Conjoint-Phase optimal kombinieren zu können. Bei 
der CCC präsentierte das Programm hierfür 9 Produktprofile, deren Konstruktion 
wie in der Conjoint-Phase einem orthogonalen Designplan entsprach. Die Aus- 
prägungen der 4 Kerneigenschaften wurden jedoch neu kombiniert, so daß sich 
die Produktprofile so weit wie möglich von den bereits abgefragten unterschie- 
den. In der Kombinationsphase der CHIC hatten die Probanden jeweils ein zu- 
sätzliches Choice-Set zu beurteilen, das nicht in die Schätzung der Conjoint- 
Teilnutzenwerte einging. Die prinzipielle Aufgabenstellung für das Kalibrie- 
rungsset stimmte bei beiden Verfahren jeweils mit der Conjoint-Phase überein. 
Im Gegensatz dazu waren die Probanden in der Kombinationsphase bei der ACA 
aufgefordert, separat für 6 Produktkonzepte (beschrieben durch 5 Eigenschaften) 
eine Kaufwahrscheinlichkeit von 0% bis 100% anzugeben.^^^ Dabei werden diese 



Mit der Wahl einer 9-Punkte-Skala wird bei der Paarvergleichsaufgabe die gleiche Rating- 
Skala verwendet wie in der Self-Explicated-Phase des ACA-Interviews, was die Vergleich- 
barkeit der Ergebnisse zwischen diesen beiden Phasen erhöht. 

In Zusammenhang mit der Kombinationsphase der drei Verfahren werden die Begriffe 
Kalibrierungsset und Validation-Set (vgl. Kapitel 3) synonym verwendet. 

Das System der ACA 4.0 ermöglicht die Wahl zwischen mindestens 4 und maximal 9 Ka- 
librierungskonzepten. Sofern die Ergebnisse des Self-Explicated-Teils und der Paarver- 
gleichsaufgabe durch optimale Gewichtung (anstatt einer Gleichgewichtung) kombiniert 
werden sollen, wird die Abfrage von wenigstens 5 Konzepten empfohlen (vgl. Metegrano 
(1994), S. 3-34). Mit der Festlegung von 6 Produktkonzepten wird diese Mindestanforde- 
rung auf jeden Fall erfüllt. 
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Produktkonzepte immer so konstruiert, daß zunächst das Konzept mit dem nied- 
rigsten Nutzen und als zweites das mit dem höchsten Nutzen zu bewerten ist. 
Diese beiden Eckpunkte sollen als Anker für die Bewertung dazwischen liegen- 
der Produktkonzepte fungieren.^^^ Für deren Konstruktion greift das Programm 
auf die Informationen sowohl aus der Self-Explicated-Phase als auch aus der 
Paarvergleichsaufgabe zurück. 

Mit dieser zusätzlichen Anpassung der Kombinationsphase an die Ergebnisse der 
Conjoint-Phase, ist die beschriebene Reihenfolge der 3 Interviewphasen für die 
ACA zwingend vorgegeben. Dagegen besteht bei der CCC und der CHIC die 
Möglichkeit, die Abfrage des Kalibrierungssets zwischen der Self-Explicated- 
und der Conjoint-Phase beurteilen zu lassen.^^^ Für ein solches Vorgehen spricht, 
daß die Gefahr reduziert wird, die Prognoseergebnisse durch eine Wiederholung 
der Conjoint- Aufgabe und damit verbundener Lerneffekte zu verzerren.^^^ So 
argumentieren Huber et al. (1993) beispielsweise, daß die Validität einer Voll- 
Profil Conjoint- Analyse erhöht werden kann, wenn vor der eigentlichen Haupt- 
aufgabe eine „Warmup-Phase“ integriert wird, um die Probanden mit der Aufga- 
be vertraut zu machen.^^^ Für die CCC und die CHIC besteht hierin eine Gefahr. 
Die Kombination der Teilnutzenwerte kann durch die Ähnlichkeit der Aufgaben- 
stellung zwischen Conjoint- und Kombinationsphase durch einen Reihenfol- 
geeffekt zugunsten der Conjoint- Werte verstärkt werden. Srinivasan/Park (1997) 
berichten beispielsweise, daß bei 73% der Probanden die Conjoint-Teilnutzen ein 
höheres Gewicht erhalten als die Self-Explicated-Werte. Als einen Grund für die- 
ses Ergebnis fuhren die Autoren die Ähnlichkeit zwischen der Conjoint- und 
Kombinationsaufgabe an.^^® Vor diesem Hintergrund diente im vorliegenden 
Datensatz (analog zum Vorgehen von Srinivasan/Park (1997)) jeweils das erste 
Design bei der CCC bzw. das erste Choice-Set bei der CHIC als Kalibrierungs- 



Vgl. Metegrano (1994), S. 3-9. 

In diesem Fall dienen die in der dritten Interviewphase (bisher Kombinationsphase) erho- 
benen Daten zur Schätzung von Teilnutzenwerten, die dann zur Prognose der Präferenzur- 
teile der zweiten Interviewphase (bisher Conjoint-Phase) herangezogen werden. 

Vgl. Srinivasan/Park (1997), S. 288. 

Vgl. Huber et al.( 1993), S. 111. 

Vgl. Srinivasan/Park (1997), S. 289. 
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set.^^* Dieser Reihenfolgeeffekt spielt bei der ACA keine (wesentliche) Rolle, da 
sich die Aufgabe der Kombinationsphase maßgeblich von der Paarvergleichsauf- 
gabe unterscheidet. 

Die Bestimmung der optimalen Gewichtung von Self-Explicated- und der Con- 
joint-Teilnutzenwerte entsprach bei der CCC und der CHIC der in Kapitel 3.1 
beschriebenen Vorgehensweise. Für jede Testperson wurde aus alternativen Ge- 
wichten (Wi=0; 0,01; 0,02; ... ; 1, wobei iel) jeweils das optimale Gewicht Wj* 
ausgewählt, bei der sich die maximale Übereinstimmung zwischen prognosti- 
zierten und beobachteten Präferenzen für das Kalibrierungsset ergab. Während 
bei der CCC die prognostizierten Präferenzen (gemessen durch die Gesamtnut- 
zenwerte) in eine Rangfolge transformiert wurden, gingen bei der CHIC auch die 
Präferenzunterschiede in die Prognose ein. In Abhängigkeit des damit verbunde- 
nen Skalenniveaus konnte die Übereinstimmung durch den Korrelationskoeffizi- 
enten nach Kendall (bei der CCC) bzw. Pearson (bei der CHIC) gemessen wer- 
den. In Tabelle 4-4 ist eine Häufigkeitsverteilung der ermittelten Gewichtungs- 
faktoren Wi* für die CCC und die CHIC angegeben. Darüber hinaus sind die ent- 
sprechenden Werte in der Studie von Srinivasan/Park (1997) angeführt. Ein Ver- 
gleich der Häufigkeiten zeigt, daß ähnlich zu den Befunden von Srinivasan/Park 
(1997) auch bei der CCC bei mehr als der Hälfte der Probanden (60%) die Con- 
joint-Teilnutzenwerte ein höheres Gewicht als die der Self-Explicated-Phase 
aufweisen. Im Gegensatz dazu sinkt dieser Anteil bei der CHIC auf 46%. Dieser 
Rückgang erscheint plausibel, wenn man berücksichtigt, daß bei der CHIC die 
Informationen der Self-Explicated-Phase zusätzlich bei der Bestimmung der ab- 
hängigen Variable für die Conjoint- Analyse einfließen und damit implizit eine 
höhere Bedeutung für die Conjoint-Phase erlangen. Als zweites Ergebnis ist an- 
zuführen, daß die beiden Randbereiche (0 bis 0,1) und (0,91 bis 1,0) bei der vor- 
liegenden Studie stärker besetzt sind als bei den Vergleichswerten von Sriniva- 
san/Park (1997). Somit tritt bei der CCC und der CHIC häufiger der Fall auf, daß 
die beste Prognose für das Kalibrierungsset mit den Ergebnissen einer der beiden 
Phasen (nahezu) allein erzielt werden als über deren Kombination. Ob dies insge- 
samt häufiger mit der Self-Explicated-Phase oder der Conjoint-Phase gelingt. 



Bei der CHIC mußte bei einem Teil der Probanden mit einem 3*3*2*2-Design der Kernei- 
genschaften das zweite Choice-Set als Kalibrierungsset herangezogen werden, da andern- 
falls die verbleibenden 8 Stimuli ein unlösbares Gesamtdesign gebildet hätten. 
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kann nicht eindeutig abgeleitet werden. Während bei der CCC hohe Gewich- 
tungsfaktoren häufiger auftreten (13,2% vs. 23,1%), ist dies bei der CHIC genau 
umgekehrt (19,7% VS. 12,0%). 



Tabelle 4-4; Häufigkeitsverteilung der optimalen Gewichtungs- 



faktoren Wj* im Vergleich 



Optimaler 
Gewichtungs- 
faktor Wi* 


Anteil der Probanden in % | 


CCA“> 


CCC 


CHIC 


Obis 0,1*” 


2,8 


13,2 


19,7 


0,1 1 bis 0,2 


3,7 


6,6 


9,8 


0,21 bis 0,3 


3,7 


7,0 


9,8 


0,31 bis 0,4 


5,6 


4,1 


9,0 


0,41 bis 0,5 


11,1 


8,7 


5,6 


0,51 bis 0,6 


9,3 




7,4 




13,7 




0,61 bis 0,7 


14,8 




6,6 




8,5 




0,71 bis 0,8 


20,4 


=73 


9,1 


=60 


7,3 


=46 


0,81 bis 0,9 


19,4 




14,0 




4,7 




0,91 bis 1,0 


9,2 




23,1 




12,0 




Gesamt: 


100,0 


100,0 


100,0 



a) Quelle: Srinivasan/Park (1997), S. 289 

b) Ein Gewichtungsfaktor z.B. von 0,1 impliziert, daß der Conjoint-Teilnutzen mit einem 
Gewicht von 0,1 und der Self-Explicated-Teilnutzen mit einem Gewicht von 0,9 in 

die kombinierten Teilnutzenwerte eingeht (vgl. Gleichung (3-2) in Kapitel 3.1.3). 

Bei der ACA wird die Gewichtung durch eine Regressionsanalyse ermittelt, bei 
der die Logits der erhobenen Kaufwahrscheinlichkeiten für die Kalibrierungs- 
konzepte vorhergesagt werden (vgl. Abschnitt 3.3.3). Als Ergebnis liefert das 
System neben einer Konstanten zwei Regressionskoeffizienten, mit denen die 
Self-Explicated-Teilnutzenwerte und die der Paarvergleichsaufgabe gewichtet 
werden, um die Logits der erhobenen Kaufwahrscheinlichkeiten bestmöglich 
prognostizieren zu können. Diese Regressionskoeffizienten entsprechen inhalt- 
lich den Gewichtungsfaktoren Wj* bei der CCC und der CHIC. Da die Regressi- 
onskoeffizienten nicht wie die Gewichtungsfaktoren Wj in einem festen Wertebe- 
reich definiert sind, ist eine direkte Gegenüberstellung in ihrer absoluten Höhe 
nicht möglich. Aus diesem Grund sind die Regressionskoeffizienten der ACA 
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nicht in Tabelle 4-4 ausgewiesen. Ein Vergleich zwischen den Regressions- 
koeffizienten für den Self-Explicated-Teil und die Paarvergleichsaufgabe inner- 
halb der ACA ist dagegen zulässig. Eine entsprechende Auswertung dieser 
Koeffizienten ergab, daß bei 72 der 249 Probanden, also in 29 % der Fälle, die 
geschätzten Teilnutzenwerte der Paarvergleichsaufgabe mit einem höheren Ge- 
wicht als die Self-Explicated-Teilnutzenwerte eingehen. Dieser Anteil fällt deut- 
lich geringer aus als bei der CCC und CHIC. Zieht man zudem in Betracht, daß 
bei weiteren 160 Probanden (also fast 65% aller Probanden) die Teilnutzenwerte 
exakt gleich gewichtet wurden, bestätigt dies implizit die Vermutung, daß durch 
Wiederholung der Conjoint- Aufgabe in der Kombinationsphase die Ergebnisse 
bzw. die Gewichtung der Teilnutzen werte zugunsten der wiederholten Aufgabe 
verzerrt werden können. Der Anteil an Probanden, bei denen Wj* >0,5 ist und 
damit den Conjoint-Teilnutzen ein höheres Gewicht als den Self-Explicated- 
Teilnutzen zukommt, ist bei beiden neuen Verfahren deutlich höher als bei der 
ACA (vgl. hierzu die Häufigkeiten für Wj* >0,5 bei der CCC und CHIC in Ta- 
belle 4-4). Gleichzeitig ist durch die Gegenüberstellung der Ergebnisse in Tabelle 
4-4 ersichtlich, daß dieser Effekt in der vorliegenden Untersuchung weniger stark 
ausgeprägt ist als bei Srinivasan/Park (1997). 

4.3.4 Zusatzdaten und Kaufsimulation 

In Ergänzung zum eigentlichen Conjoint-Interview wurden jeweils am Ende der 
Befragungen demografische Daten sowie Informationen zu Kauf- und Markener- 
fahrung bei Kühlschränken bzw. Haushaltsgroßgeräten erhoben. Den Abschluß 
des Gesamtinterviews bildete eine simulierte Kaufentscheidung. Dieser Befra- 
gungsschritt diente als Holdout- Set, um die Prognosegüte der alternativen Ver- 
fahren überprüfen zu können. Die Validierung alternativer Methoden zur Präfe- 
renzmessung auf Basis einer Holdout- Aufgabe ist in der Literatur sehr weit ver- 
breitet und liefert die Grundlage der meisten Validitätsvergleiche.^^^ 

Trotz der häufigen Anwendung einer Holdout- Aufgabe zur Validierung der Er- 
gebnisse ist die Frage nach der Gestaltung eines Holdout-Sets in der Literatur 
bisher vernachlässigt worden. Die Entscheidungshilfen zur Zusammenstellung 
der Holdout-Konzepte beschränken sich bislang darauf, daß zum einen keine do- 



Vgl. hierzu die Dominanz dieses Kriteriums im Literaturüberblick in Kapitel 2 der vorlie- 
genden Arbeit. 
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minanten Alternativen im Set enthalten sein sollen. Zum anderen ist darauf zu 
achten, daß die Angebote des Holdout-Sets in ihrer Attraktivität nicht zu ähnlich 
sind. Die Einhaltung dieser beiden Prinzipien wird allerdings dadurch erschwert, 
daß oft keine a priori Kenntnisse über die Präferenzstrukturen der Probanden 
vorliegen. In diesem Fall können keine Annahmen hinsichtlich der Attraktivität 
alternativer Produktkonzepte getroffen und bei der Konzeption des Holdout-Sets 
berücksichtigt werden.^^^ Einen Lösungsvorschlag hierzu liefern Herr- 
mann/Schmidt-Gallas/Huber (2000), die das Holdout-Set im Anschluß an ein 
ACA-Interview ebenfalls computergestützt und unter Berücksichtigung der be- 
reits erhobenen Informationen für alle Probanden individuell gestalten.^^"^ Wit- 
tink/Bergestuen (1999) fuhren eine dritte Bedingung an. Die Holdout- Aufgabe 
sollte so nah wie möglich an der tatsächlichen Kaufsituation orientiert sein.^^^ 
Aufgrund dessen bestand das Holdout-Set aus 5 Produktbeschreibungen, die zum 
Zeitpunkt der Befragung real am Markt existierenden Angeboten des betrachteten 
Preissegments für Tischkühlschränke entsprachen. Um zu vermeiden, daß die 
Produktkonzepte des Holdout-Sets zu ähnlich sind, wurde die gesamte Band- 
breite aller betrachteten Eigenschaftsausprägungen berücksichtigt. Insgesamt 
wurden 5 Eigenschaften zur Beschreibung der Kühlschränke herangezogen.^^^ Da 
insbesondere für die Eigenschaft „Marke“ keine a priori Informationen über die 
Präferenzen bei den Probanden vorliegen, kann über die Dominanz der verschie- 
denen Alternativen keine eindeutige Aussage gemacht werden.^^^ Tabelle 4-5 
zeigt die Produktkonzepte der Holdout-Aufgabe. 



Zu den Empfehlungen bezüglich der Gestaltung eines Holdout-Sets vgl. Johnson (1997a), 
Vgl. Herrmann/Schmidt-Gallas/Huber (2000), S. 264 ff 
Vgl. Wittink/Bergestuen (1999), S. 10. 

Es handelte sich um die Eigenschaften Marke, Preis, Energieverbrauch, Nutzinhalt und 
Sterne des Gefrierfachs. Es sind dies die Eigenschaften, deren Ausweis bei der Produktprä- 
sentation gesetzlich vorgeschrieben ist. 

Ähnliches gilt für die Eigenschaft „Sterne des Gefrierfachs“, da ein 3-Sterne-Fach gegen- 
über einem 1-Sterne-Fach nicht eindeutig präferiert wird. 
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Tabelle 4-5: Produktbeschreibungen im Holdout-Set flir die simulierte Kaufent- 



scheidung 



Angebot 1 


Angebot 2 


Angebot 3 


Angebot 4 


Angebot 5 


AEG 


Liebherr 


Siemens 


Electrolux 


Quelle Privileg 


145 Liter 


145 Liter 


125 Liter 


120 Liter 


120 Liter 


***-Fach 


*-Fach 


***-Fach 


***-Fach 


***-Fach 


208 kWh/Jahr 


222 kWh/Jahr 


245 kWh/Jahr 


237 kWh/Jahr 


175 kWh/Jahr 


659,- DM 


449,- DM 


599,- DM 


549,- DM 


649,- DM 



Die 5 Produktbeschreibungen wurden den Probanden am Ende des Interviews auf 
einem schriftlichen Fragebogen präsentiert. Die Beurteilungsaufgabe für alle 
Probanden bestand darin, für die Angebote des Holdout-Sets die Rangfolge an- 
zugeben, in der sie diese Kühlschränke am ehesten kaufen würden. 



4.3.5 EDV-Implementierung 

Bei den in dieser Arbeit betrachteten Verfahren handelt es sich um vollständig 
PC-gestützte Interviews. Die Verfahren CCC und CHIC sind Windows-gestützte 
Befragungsprogramme, die mit der objektorientierten Programmiersprache Del- 
phi 1 .0 programmiert wurden. Die erstmalige Entwicklung der für die Befragung 
eingesetzten Software beanspruchte einen erheblichen Zeit- und Kostenaufwand. 
So fielen allein für die Programmierarbeiten bei der Entwicklung der CCC und 
CHIC mehr als 1000 Personalstunden an.^^* Neben der eigentlichen Conjoint- 
Aufgabe wurden auch sämtliche sozio-demografischen Daten und Zusatzfragen 
zu Kauferfahrungen im Rahmen des PC-Interviews erfaßt. Für das ACA- 
Interview wurde die Version 4.0 von Sawtooth Software eingesetzt. Es handelt 
sich dabei um eine DOS-Version, die sowohl die Datenerhebung als auch die di- 
rekte Datenauswertung und verschiedene Simulationsmodule umfaßt.^^® Durch 
eine Verbindung des ACA-Interviews mit dem Befragungsprogramm Ci3, eben- 



Für die Unterstützung bei den Programmierarbeiten dankt die Autorin ganz herzlich Frau 
Simone Martin. 

Für die Bereitstellung des Programms sei dem Marktforschungsinstitut IPSOS Deutschland 
an dieser Stelle ausdrücklich gedankt. 

Mittlerweile liegt mit Sensus-TradeOff 1.0 und 2.0 eine Windows-gestützte Version der 
ACA vor. Ein Einsatz dieser multimedialen Version war zum Zeitpunkt der Datenerhebung 
leider noch nicht möglich. 
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falls von Sawtooth Software, konnten auch hier alle demografischen Daten und 
Zusatzfragen PC-gestützt erhoben werden. Im Anhang der Arbeit sind exempla- 
risch die Bildschirmmasken der einzelnen Befragungsschritte bei den neu ent- 
wickelten Verfahren angeführt. 

Mit der Integration der Datenauswertung in den Interviewablauf bei der ACA 
wird nicht nur eine stärkere Anpassung der Befragungsschritte an vorangegange- 
ne Antworten ermöglicht, sondern auch ein entscheidender Vorteil unter Anwen- 
dungsgesichtspunkten gegenüber den beiden neu vorgestellten Verfahren gebo- 
ten. Innerhalb eines Softwarepaketes liefert die ACA dem Marktforscher das Be- 
fragungsprogramm und für jede Interviewphase die geschätzten Teilnutzenwerte. 
Darüber hinaus bietet das System die Möglichkeit, verschiedene Simulations- 
analysen durchzufuhren. Im Gegensatz hierzu liegen nach Abschluß der CCC- 
und CHIC-Interviews zunächst allein die „Rohdaten“ vor, die in weiteren Analy- 
seschritten vom Marktforscher ausgewertet werden müssen. Die vorgenommene 
Individualisierung der Befragungsschritte und speziell der Designerstellung bei 
der Conjoint- Aufgabe erfordern dabei zunächst eine separate Auswertung der 
erhobenen Daten jedes einzelnen Probanden. Um den neuen Verfahren eine Ver- 
breitung in der Praxis zu ermöglichen, ist (zumindest teilweise) die Implementie- 
rung der Datenauswertung in einem Software-Paket unerläßlich und bereits 
Schwerpunkt weiterer Forschungsprojekte. 
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5 Empirischer Vaüditätsvergleich 

In Kapitel 3 sind die beiden neuen adaptiven Verfahren CCC und CHIC sowie 
die ACA vorgestellt worden. Neben der Darstellung der einzelnen Befragungs- 
schritte in der Self-Explicated-, Conjoint- und Kombinationsphase wurden die 
methodischen Unterschiede zwischen diesen Verfahren aufgezeigt. Nach dieser 
konzeptionellen Gegenüberstellung werden sie im folgenden einer empirischen 
Validitätsprüfung unterzogen. Die ACA als etabliertes Verfahren dient dabei als 
Referenzpunkt für die Ergebnisgüte der beiden neuen Methoden. Gleichzeitig 
kann ein direkter Vergleich der neuen Verfahren mit der ACA zeigen, ob alterna- 
tive Vorgehensweise vor allem bei der Datenerhebung in der Conjoint-Phase zu 
valideren Ergebnissen fuhren. Beispielsweise ist bei der ACA bisher die Konzep- 
tion der Paarvergleichsaufgabe häufig als Schwachpunkt des Verfahrens ange- 
führt worden. 

Ein wichtiges Ergebnis der Zusammenstellung bisheriger empirischer Ver- 
gleichsstudien war das relativ gute Abschneiden der Self-Explicated-Methode 
sowohl im Vergleich zu rein dekompositioneilen als auch zu unterschiedlichen 
hybriden Varianten der Conjoint-Analyse. Zahlreiche Vergleiche bescheinigten 
der Self-Explicated-Methode eine gleich gute und teilweise sogar eine signifikant 
höhere Validität. Vor dem Hintergrund dieser Ergebnisse wird die Self- 
Explicated-Methode als alternative Vorgehensweise zur Präferenzmessung auch 
in den folgenden Validitätsvergleich einbezogen. Hierfür wird bei allen drei ad- 
aptiven Verfahren ACA, CCC und CHIC eine separate Auswertung der ersten 
Interviewphase (Self-Explicated-Phase) vorgenommen und mit SE-ACA, SE- 
CCC und SE-CHIC bezeichnet. Der Validitätsvergleich umfaßt somit insgesamt 8 
unterschiedliche Ansätze. Es sind dies die drei Self-Explicated- Varianten^^^ so- 
wie die drei adaptiven Verfahren ACA, CCC und CHIC, wobei bei den neuen 
Verfahren jeweils zwischen CCC-alt und CCC-neu bzw. CHIC-alt und CHIC-neu 



Vgl. Green/Srinivasan (1990), S. 11; Green/Krieger/Agarwal (1991), S. 220 f; Reiners 
(1996), S. 78 f ; Srinivasan/Park (1997), S. 286. 

Vgl. hierzu die Ausführungen in Kapitel 2.3.2 und 2.5.2. 

Dabei sei einschränkend angemerkt, daß nur 2 verschiedene Varianten der Self-Explicated- 
Methode verglichen werden, da die Vorgehensweise bei der SE-CCC und SE-CHIC iden- 
tisch ist. 
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differenziert wird, um den Effekt der modifizierten Schätzmethode in der Kom- 
binationsphase quantifizieren zu können (vgl. Abschnitt 3.1.3 und 3.2.3). 

Die vergleichende Validitätsprüfung aller 8 Methoden wird anhand verschiedener 
Gütekriterien vorgenommen. Es sind dies die gleichen Kriterien, die bereits zur 
Systematisierung der bisherigen Forschungsergebnisse in Kapitel 2 dienten: 

1. diskriminierende Validität, 

2. interne Validität, 

3. Prognosevalidität, 

4. externe Validität.^^"^ 

Einzige Ausnahme bildet die Reliabilität, die in der vorliegenden Studie nicht als 
weiteres Gütekriterium integriert wurde. Voraussetzung für einen entsprechenden 
Test wäre eine zumindest teilweise Wiederholung der Befragung derselben Per- 
son mit der gleichen Datenerhebungsmethode. Auf diesen zusätzlichen Befra- 
gungsschritt wurde verzichtet, um die Auskunftsbereitschaft der Probanden nicht 
zu überfordern. Die Ergebnisse hinsichtlich der vier Gütekriterien werden in den 
folgenden vier Kapiteln (5.1 - 5.4) dargestellt. Abschnitt 5.5 faßt die wesentli- 
chen Befunde der empirischen Validitätsprüfung noch einmal zusammen. 

5.1 Diskriminierende Validität 

Mit dem Kriterium der diskriminierenden Validität soll überprüft werden, ob die 
untersuchten Methoden zur Messung von Nachfragerpräferenzen zu unterschied- 
lichen Ergebnissen in bezug auf die geschätzten Präferenzstrukturen führen. Da 
sich die betrachteten Verfahren in der Datenerhebungsmethode und/oder in der 
Vorgehensweise zur Schätzung der Teilnutzenwerte z.T. maßgeblich unterschei- 
den, ist zu vermuten, daß die ermittelten Präferenzstrukturen in Abhängigkeit von 
der eingesetzten Methode variieren.^^^ Somit gilt es zu testen, ob und inwieweit 
die Ergebnisse von der Vorgehensweise zur Erfassung der Präferenzstrukturen 
beeinflußt werden. Treten in diesem Punkt keine Unterschiede zwischen den Ver- 
fahren auf, kann für alle Methoden die gleiche Prognosegüte erwartet werden. 



Zur Definition und Abgrenzung der Kriterien vgl. Kapitel 2.2.2. 1 . 

Es sei darauf hingewiesen, daß an dieser Stelle ebenso die konvergierende Validität gete- 
stet werden könnte. Wie in Kapitel 2.2.2. 1 diskutiert, entspricht eine Überprüfung der kon- 
vergierenden Validität der gleichen Vorgehensweise, wobei lediglich die Ausgangshypo- 
these für die Tests umgekehrt formuliert wird. In diesem Fall werden keine Unterschiede 
zwischen den verschiedenen Verfahren erwartet. 
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Diese Folgerung begründet sich darin, daß alle weiteren Analysen auf den ermit- 
telten Präferenzstrukturen basieren, die durch die Teilnutzenwerte und Bedeu- 
tungsgewichte abgebildet werden. Für die Anwendung der Verfahren in der 
Marktforschung würde ein solches Ergebnis bedeuten, daß nur Kosten- und Zeit- 
aufwand beim Einsatz eines Verfahren ausschlaggebende Entscheidungskriterien 
sein können, ohne die Verläßlichkeit und den Aussagegehalt der Ergebnisse ein- 
zuschränken. 

5.1.1 Diskriminierende Validität zwischen alternativen Formen 
der Präferenzabfrage 

In Kapitel 2 wurden die dekompositioneilen Ansätze zur Präferenzmessung an- 
hand der Kriterien „Anzahl simultan zu bewertender Stimuli“ und „Gestaltung 
der Präferenzabfrage bei der Bewertung der Produktkonzepte“ abgegrenzt. Wäh- 
rend die Anzahl der Stimuli in der vorliegenden Untersuchung nicht unabhängig 
von weiteren Einflußgrößen variiert wurde, kann der Effekt der Präferenzabfrage 
im Rahmen des CCC-Interviews isoliert betrachtet werden. In der Conjoint-Phase 
der CCC wurden die Präferenzen für die verschiedenen Produktkonzepte sowohl 
durch Rangreihung als auch anhand einer Kaufwahrscheinlichkeitsskala von 0% 
bis 100% erhoben. Der vorliegende Datensatz bietet durch diese Zweistufigkeit 
der Beurteilungsaufgabe eine direkte Vergleichsmöglichkeit zwischen den beiden 
Formen der Präferenzabfrage. Eine Gegenüberstellung der Ergebnisse wird zei- 
gen, ob die zusätzliche Quantifizierung der Präferenzunterschiede in Form von 
Kaufwahrscheinlichkeiten zu unterschiedlichen, im besten Fall valideren Ergeb- 
nissen fuhrt. 

Für den Vergleich der Präferenzstrukturen wurden die individuellen Bedeutungs- 
gewichte für die Kerneigenschaften sowohl auf Basis der Rangdaten als auch 
unter Verwendung der Kaufwahrscheinlichkeitsdaten berechnet. Grundlage hier- 
für bilden jeweils die geschätzten Teilnutzenwerte. Dividiert man die Spannwei- 
te^^^ der Teilnutzenwerte einer Eigenschaft durch die Summe aller Spannweiten 
der betrachteten Eigenschaften, erhält man die relative Wichtigkeit dieser Eigen- 
schaft, die üblicherweise als Bedeutungsgewicht bezeichnet wird.^^^ Aufgrund 



Die Spannweite stellt den Unterschied zwischen maximalem und minimalem Teilnutzen- 
wert einer Eigenschaft dar. 

Vgl. z.B. Mengen/Simon (1996), S. 234. 
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des unterschiedlichen Skalenniveaus der erhobenen Präferenzdaten erfolgte die 
Bestimmung der Teilnutzenwerte für die betrachteten Fälle nicht durch das glei- 
che Schätzverfahren. So wurden die Rangdaten mit LINMAP und die Kaufwahr- 
scheinlichkeitsdaten mittels einer OLS-Schätzung ausgewertet. Damit wird die 
isolierte Betrachtung der Präferenzabfrage teilweise eingeschränkt. Allerdings 
hätte der Vergleich durch Einsatz des gleichen Schätzverfahrens an Aussagege- 
halt verloren. Eine Auswertung der Kaufwahrscheinlichkeitsdaten mit LINMAP 
ist grundsätzlich möglich, da das Verfahren als abhängige Variable auch Rating- 
Daten zuläßt. In der Schätzung berücksichtigt LINMAP allerdings nur die ordi- 
nalen Informationen der Präferenzdaten.^^^ Aus diesem Grund wurde die Schät- 
zung der Teilnutzen werte mittels OLS-Methode vorgenommen, wobei die Kauf- 
wahrscheinlichkeitsdaten die abhängige Variable bildeten. Der umgekehrte Fall, 
also eine Auswertung der Rangdaten auf Basis einer OLS-Schätzung, würde eher 
eine Überprüfung des geeigneten Schätzverfahrens bei ordinalem Skalenniveau 
anstatt der Form der Präferenzabfrage bedeuten. Aufgrund dieser Argumente 
wurde der zusätzliche Einflußfaktor auf die Ergebnisse durch unterschiedliche 
Schätzverfahren in Kauf genommen und abhängig vom Skalenniveau der Präfe- 
renzdaten das entsprechende Schätz verfahren eingesetzt. 

Als Gütemaß zur Quantifizierung der Unterschiede zwischen den beiden Formen 
der Beurteilungsaufgabe wurde die mittlere absolute Abweichung zwischen den 
individuellen Bedeutungsgewichten für alle 4 Kerneigenschaften berechnet. Eine 
Häufigkeitsverteilung dieses individuellen Gütemaßes über alle Probanden ist in 
Abbildung 5-1 grafisch dargestellt. 



Vgl. hierzu auch die Argumentation hinsichtlich des eingesetzten Schätzverfahrens bei der 
CCC in Kapitel4.3.2. 
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Abbildung 5-1 : Häufigkeitsverteilung der individuellen mittleren absoluten Ab- 
weichungen zwischen den Bedeutungsgewichten auf Basis der 
Rangdaten und der Kaufwahrscheinlichkeiten (n=242) 




0,05 0.1 0,15 0,2 0.25 0.3 0.35 0,4 0.45 



Mittlere absolute Abweichung zwischen den Bedeutungs gewichten 



Der Mittelwert der mittleren absoluten Abweichung über alle 242 Probanden be- 
trägt MW=0,096 (Standardabweichung SA=0,071). Da die Bedeutungsgewichte 
eine relative Größe darstellen, impliziert dieser Wert, daß die geschätzten Be- 
deutungsgewichte der individuellen Kerneigenschaften, ermittelt auf Basis der 
beiden alternativen Präferenzabfragen, durchschnittlich um weniger als 10% von- 
einander abweichen. Die Häufigkeitsverteilung verdeutlicht dabei, daß 221 Pro- 
banden um diesen Mittelwert schwanken. Lediglich 21 Probanden weisen eine 
mittlere absolute Abweichung auf, die größer als 0,2 ist. 

Die Auswertung dieses Güteindex zeigt, daß je nach Form der Präferenzabfrage 
auf individueller Ebene z.T. Abweichungen in den Ergebnissen auftreten. Unklar 
ist allerdings, ob diese Unterschiede statistisch signifikant sind. Ein entsprechen- 
der Test auf individuellem Niveau ist aufgrund der unterschiedlichen Schätzver- 
fahren problematisch. Um dennoch eine Aussage zur Signifikanz der Unterschie- 
de machen zu können, wurde für jede Eigenschaft ein Test auf Verteilungsunter- 
schiede durchgefuhrt. Zur Anwendung kam ein Wilcoxon-Test für Paardifferen- 
zen bei zwei abhängigen Stichproben, wodurch der direkte Vergleich der beiden 
Schätzergebnisse bei jeder Testperson gewährleistet war. Es handelt sich bei die- 
sem Test um ein verteilungsfreies Verfahren, das zwei abhängige Stichproben auf 
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Gleichheit hinsichtlich ihrer zentralen Tendenz überprüft.^^^ Die Testergebnisse 
gibt Tabelle 5-1 wieder. Der Stichprobenumfang je Eigenschaft hängt davon ab, 
wie häufig die entsprechende Eigenschaft als Kerneigenschaft auftritt. 



Tabelle 5-1 : Unterschiede zwischen den Bedeutungsgewichten auf Basis 
der Ranking- und den Kaufwahrscheinlichkeitsdaten bei der 
CCC (Wilcoxon-Test für abhängige Stichproben) 



Eigenschaft 


Häufigkeit 

als 

Kerneigen- 

schaft 


Kritische 

Irrtumswahr- 

scheinlichkeit 


Unterschied 
zwischen den 
Stichproben 


Marke 


96 


p=0,892 


n.s. 


Preis 


152 


p=0,365 


n.s. 


Energiekosten 
pro Jahr 


192 


p-0,054 


schwach 

signifikant 


Garantie 


99 


p=0,555 


n.s. 


Nutzinhalt 


120 


p=0,494 


n.s. 


Innen- 

ausstattung 


70 


p=0,647 


n.s. 


Abtau- 

automatik 


140 


p=0,045 


schwach 

signifikant 


Gefrierfach 


99 


p=0,205 


n.s. 



Das zentrale Ergebnis der Verteilungstests ist, daß für 6 der 8 Eigenschaften kei- 
ne signifikanten Unterschiede (p>0,2) zwischen den Ergebnissen der beiden Prä- 
ferenzabfragen auftreten. Lediglich für die Eigenschaften „Energiekosten“ und 
„Abtauautomatik“ kann die Hypothese auf Gleichheit der beiden Stichproben 
nicht angenommen werden. Allerdings weisen die in Tabelle 5-1 angegebenen 
kritischen Irrtumswahrscheinlichkeiten von p=0,054 und p=0,045 nur auf einen 
schwach signifikanten Unterschied hin. 

Die Überprüfung der diskriminierenden Validität innerhalb der Conjoint-Phase 
der CCC liefert damit ein erstes wichtiges Ergebnis. Beide Formen der Präfe- 
renzabfrage fuhren zu vergleichbaren Ergebnissen hinsichtlich der geschätzten 
Präferenzstrukturen der Probanden. Ein Vergleich der Bedeutungsgewichte auf 
individuellem Niveau zeigt, daß diese teilweise in geringem Maße voneinander 
abweichen. Ein Verteilungstest belegt aber gleichzeitig, daß bei sechs Eigen- 

Zum Wilcoxon-Test auf Gleichheit zweier abhängiger Stichproben vgl. Bortz (1993), 

S. 144 f. 
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schäften diese Unterschiede in den Bedeutungsgewichten nicht und bei zwei Ei- 
genschaften lediglich schwach signifikant sind. Für die vorliegende Untersu- 
chung kann somit keine diskriminierende Validität zwischen einer Präferenzab- 
frage auf Basis von Rangdaten und der Abfrage von Kaufwahrscheinlichkeiten 
nachgewiesen werden. Dieses Ergebnis entspricht in seiner Tendenz den empiri- 
schen Befunden bisheriger Vergleiche zwischen Ranking- und Rating-Daten. Der 
Informationsgewinn durch Bewertung der Präferenzunterschiede hat sich bei den 
meisten Vergleichen nicht in den empirischen Resultaten niedergeschlagen.^^® 

Unter Anwendungsgesichtspunkten impliziert dieses Ergebnis, daß eine zusätzli- 
che Präferenzabfrage in Form von Kaufwahrscheinlichkeiten, um die Abstände 
zwischen den Präferenzunterschieden zu quantifizieren, nicht zwingend notwen- 
dig ist. Bereits mit weniger Informationen können vergleichbare Resultate hin- 
sichtlich der Präferenzstrukturen erzielt werden. Ein Verzicht auf den zweiten 
Teilschritt der Präferenzabfrage fuhrt zu einer Verkürzung der Interviewzeit bei 
der CCC und kann folglich die Kosten und den Aufwand der Befragung senken. 
Entsprechend wird in den folgenden Auswertungen und Validitätsprüfungen 
nicht mehr zwischen den beiden Teilschritten der Conjoint-Phase innerhalb der 
CCC differenziert, sondern nur die Ergebnisse der Rangdaten betrachtet. Selbst- 
verständlich ist auch eine Vereinfachung der Präferenzabfrage durch Verzicht auf 
die Rangreihung der Produktkonzepte und der ausschließlichen Abfrage von 
Kaufwahrscheinlichkeiten möglich. Im vorliegenden Datensatz erfolgte die An- 
gabe der Kaufwahrscheinlichkeiten jedoch erst im Anschluß an die vorgenom- 
mene Rangreihung und stellt in diesem Fall keine unabhängige Rating- Aufgabe 
dar. Aus diesem Grund fiel die Entscheidung zur Vereinfachung auf die Rangda- 
ten. 

5.1.2 Diskriminierende Validität zwischen den untersuchten Me- 
thoden zur Präferenzmessung 

Mit dem vorangestellten Vergleich zwischen den Ergebnissen der beiden Formen 
der Präferenzabfrage wurde getestet, ob überhaupt Unterschiede auftreten. Im 
Gegensatz dazu werden bei einer Überprüfung der diskriminierenden Validität 
zwischen den untersuchten Methoden zur Präferenzmessung konkrete Unter- 



Vgl. hierzu die Ergebnisse der Studien von Huber/Herrmann/Gustafsson (2000); Leigh/ 
MacKay/Summers (1984); Kalish/Nelson (1991) und Stallmeier (1993) in Kapitel 2.2.2. 
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schiede in den Ergebnissen erwartet. Wie bereits im Rahmen des theoretischen 
Vergleichs zwischen der Conjoint- Analyse und der Self-Explicated-Methode dis- 
kutiert, liegt ein wesentliches Problem bei letzterem Verfahren in der direkten 
Frage nach der Wichtigkeit der Eigenschaften.^^’ Die Gefahr ist, daß Probanden 
das Konzept der Wichtigkeit je nach Art der Operationalisierung unterschiedlich 
interpretieren. In der Folge werden häufig wichtige Eigenschaften unterschätzt 
und weniger wichtige in ihrer Bedeutung überschätzt. Verstärkt werden kann die- 
ser Effekt, wenn alle Eigenschaften separat zu bewerten sind. Die Probanden sind 
in diesem Fall nicht zu einem Trade-Off zwischen den verschiedenen Eigen- 
schaften gezwungen, was sich in sehr ähnlichen Bedeutungsgewichten für alle 
bewerteten Eigenschaften widerspiegelt. Empirische Belege hierfür liefern z.B. 
Teas/Dellva (1985) und Stallmeier (1993). Die Autoren stellen die geschätzten 
Bedeutungsgewichte auf Basis einer Self-Explicated-Variante denen der Con- 
joint- Analyse gegenüber. In beiden Studien zeigen sich für die Conjoint- Analyse 
größere Unterschiede in den Bedeutungsgewichten der verschiedenen Eigen- 
schaften als bei direkter Frage nach deren Wichtigkeit.^^^ Darüber hinaus werden 
zwischen der SE-CCC und der SE-CHIC keinerlei Unterschiede erwartet, da es 
sich hierbei um identische Methoden handelt. Somit wird entsprechend der vor- 
genommenen Begriffsabgrenzung der Gütemaße nicht die diskriminierende, son- 
dern die konvergierende Validität zwischen diesen beiden Verfahren überprüft. 

Getestet wird die diskriminierende bzw. zwischen der SE-CCC und SE-CHIC die 
konvergierende Validität auch in der vorliegenden Studie im Hinblick auf die 
ermittelte Präferenzstruktur der Probanden. Hierfür werden separat für jede der 
acht Untersuchungsmethoden die individuellen Bedeutungsgewichte aller Pro- 
dukteigenschaften berechnet und jeweils die Mittelwerte (vgl. Tabelle 5-2) gebil- 
det. 



Vgl. Kapitel 2.3.1. 

Vgl. Teas/Dellva (1985), S. 108; Stallmeier (1993), S. 295. 
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Tabelle 5-2: Mittelwerte (Standardabweichungen) der Bedeutungsgewichte der 
Eigenschaften bei unterschiedlichen Ansätzen zur Präferenzmessung 



Eigenschaft 


ACA 


CCC- 

alt 


CCC- 

neu 


CHIC- 

alt 


CHIC- 

neu 


SE- 

ACA 


SE- 

CCC 


SE- 

CHIC 


Marke 


0,111 

(0,049) 


0,118 

(0,102) 


0,125 

(0,165) 


0,108 

(0,070) 


0,104 

(0,106) 


0,103 

(0,047) 


0,102 

(0,051) 


0,102 

(0,061) 


Preis 


0,117 

(0,050) 


0,134 

(0,098) 


0,146 

(0,157) 


0,134 

(0,071) 


0,145 

(0,109) 


0,125 

(0,032) 


0,135 

(0,043) 


0,136 

(0,047) 


Energiekosten 
pro Jahr 


0,142 

(0,054) 


0,153 

(0,104) 


0,190 

(0,160) 


0,146 

(0,082) 


0,168 

(0,125) 


0,134 

(0,030) 


0,146 

(0,041) 


0,150 

(0,044) 


Garantie 


0,115 

(0,049) 


0,106 

(0,060) 


0,086 

(0,089) 


0,126 

(0,065) 


0,120 

(0,096) 


0,130 

(0,030) 


0,125 

(0,040) 


0,127 

(0,041) 


Nutzinhalt 


0,103 

(0,043) 


0,108 

(0,060) 


0,102 

(0,101) 


0,112 

(0,056) 


0,106 

(0,079) 


0,119 

(0,031) 


0,122 

(0,040) 


0,119 

(0,041) 


Innen- 

ausstattung 


0,122 

(0,050) 


0,125 

(0,070) 


0,095 

(0,110) 


0,120 

(0,054) 


0,103 

(0,085) 


0,127 

(0,031) 


0,125 

(0,043) 


0,121 

(0,043) 


Abtau- 

automatik 


0,135 

(0,054) 


0,113 

(0,070) 


0,100 

(0,115) 


0,113 

(0,053) 


0,102 

(0,077) 


0,131 

(0,033) 


0,116 

(0,044) 


0,118 

(0,043) 


Gefrierfach 


0,155 

(0,059) 


0,144 

(0,089) 


0,155 

(0,153) 


0,141 

(0,057) 


0,152 

(0,097) 


0,131 

(0,037) 


0,130 

(0,045) 


0,128 

(0,044) 


Minimum 


0,103 


0,106 


0,086 


0,108 


0,102 


0,103 


0,102 


0,102 


Maximum 


0,155 


0,153 


0,190 


0,146 


0,168 


0,134 


0,146 


0,150 



Ein Vergleich der Ergebnisse kann die eingangs formulierte Erwartung nur teil- 
weise bestätigen. Für fast alle Methoden zeigt sich ein verhältnismäßig geringer 
Unterschied zwischen dem mittleren Bedeutungsgewicht der unwichtigsten (vgl. 
Minimum) und der wichtigsten (vgl. Maximum) Eigenschaft. Im Durchschnitt 
sind alle Eigenschaften sowohl bei den adaptiven als auch bei den Self- 
Explicated- Verfahren annähernd gleich wichtig und schwanken zwischen «10% 
und «15%. Einzige Ausnahme bildet die CCC-neu, bei der die Bedeutungsge- 
wichte insgesamt stärker variieren. Hier ist der Unterschied zwischen wichtigster 
(19%) und unwichtigster Eigenschaft (8,6%) mit über 10% doppelt so groß wie 
bei allen anderen Verfahren. Werden zudem die Standardabweichungen der dar- 
gestellten Mittelwerte in den Vergleich einbezogen, ergibt sich ein differenzierte- 
res Bild. So weisen beide Versionen der CCC und der CHIC wesentlich höhere 
Standardabweichungen vom Mittelwert auf als die Self-Explicated- Verfahren 
und die ACA. Dies deutet auf eine größere Homogenität hinsichtlich der Präfe- 
renzstrukturen in den Stichproben der letztgenannten Verfahren hin. Für die CCC 
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und die CHIC dagegen heißt das, daß zumindest für eine Teilmenge der Proban- 
den wesentlich stärkere Unterschiede zwischen der Wichtigkeit der verschiede- 
nen Eigenschaften auftreten. Das Ergebnis, daß die ACA gegenüber der CCC und 
CHIC unter Berücksichtigung der Standardabweichungen geringere Unterschiede 
in den Bedeutungsgewichten aufweist, stimmt unterdessen mit den Befunden von 
Orme/Alpert/Christensen (1997) überein. Die Autoren bestätigen, daß die Wich- 
tigkeiten der Eigenschaften bei der ACA „flacher“ verlaufen als bei Voll-Profil 
Conjoint-Analysen.^^^ 

Nach diesem vorwiegend deskriptiven Vergleich der Bedeutungsgewichte sollen 
in einem weiteren Schritt die Unterschiede zwischen den Verfahren auf Signifi- 
kanz überprüft werden. Da für 52 der 64 (8 Eigenschaften * 8 Methoden) gete- 
steten Verteilungen der Bedeutungsgewichte die Hypothese auf Normal Verteilung 
abgelehnt (p<0,l) werden mußte, war in den meisten Fällen die Anwendungsvor- 
aussetzung für einen T-Test auf Mittelwertunterschiede nicht erfüllt.^^"^ Ein Ver- 
gleich der Verteilungen der geschätzten Bedeutungsgewichte wurde deshalb an- 
hand eines Kolmogoroff-Smirnoff-Tests vorgenommen. Dies ist ein verteilungs- 
freies Verfahren, das nicht an die Anwendungs Voraussetzung der Normal Vertei- 
lung gebunden ist und ermöglicht, die Abweichungen in den Verteilungen der 
geschätzten Bedeutungsgewichte auf Signifikanz zu testen. Alle Methoden wur- 
den jeweils paarweise und separat für jede Eigenschaft miteinander verglichen. 
Die Ergebnisse der insgesamt 224 durchgeführten Tests sind in zusammengefaß- 
ter Darstellung in Tabelle 5-3 wiedergegeben.^^^ In der Tabelle werden aus Grün- 
den der Übersichtlichkeit jeweils nur die Eigenschaften ausgewiesen, bei denen 
die Verteilungen der geschätzten Bedeutungsgewichte nicht signifikant vonein- 
ander abweichen und folglich keine diskriminierende Validität zwischen dem 
jeweils betrachteten Methodenpaar vorliegt. 



Vgl. Orme/Alpert/Christensen (1997), S. 215. 

Zur Überprüfung der Verteilungsannahme wurde ein Kolmogoroff-Smirnoff-Test durchge- 
führt. Angenommen werden konnte die Hypothese auf Normalverteilung (p>0,l) nur bei 
der ACA für alle 8 Eigenschaften, bei der CHlC-alt für die Eigenschaften „Abtaumöglich- 
keit“ und „Gefrierfach“, bei der CHlC-neu für die Eigenschaft „Gefrierfach“ und für die 
Eigenschaft „Garantiedauer“ bei der SE-CCC. 

Die Anzahl an paarweisen Tests ergibt sich aus (n(n-l)/2)*8 Eigenschaften, wobei n für die 
Anzahl untersuchter Verfahren steht. 
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Tabelle 5-3: Nicht signifikante Unterschiede zwischen den Verteilungen der Be- 



deutungsgewichte der verschiedenen Methoden zur Präferenzmes- 
sung (Kolmogoroff-Smirnoff-Test p>0,l) 



Me- 

thode 


ACA 


CCC- 

alt 


ccc- 

neu 


CHIC- 

alt 


CHIC- 

neu 


SE- 

ACA 


SE- 

CCC 


SE- 

CHIC 


ACA 




Preis 

Inhalt 




Energie 

Garantie 

Innen 








Innen 


CCC- 

alt 








Marke 

Preis 

Energie 

Inhalt 

Innen 

Abtau 


Energie 




Innen 


Marke 


CCC- 

neu 










Marke 

Energie 








CHIC- 

alt 








— 


Energie 




Marke 

Innen 

Abtau 


Marke 

Innen 

Abtau 


CHIC- 

neu 


















SE- 

ACA 














Marke 


Marke 

Inhalt 


SE- 

CCC 
















Marke 

Preis 

Energie 

Garantie 

Inhalt 

Innen 

Abtau 

Gefrier 


SE- 

CHIC 



















Wie die Ergebnisse in Tabelle 5-3 zeigen, treten nur bei 35 aller 224 getesteten 
Vergleiche keine signifikanten Unterschiede zwischen den Verteilungen der ge- 
schätzten Parameter auf Berücksichtigt man, daß zwischen der SE-CCC und die 
SE-CHIC als identische Verfahren die konvergierende Validität getestet wird und 
folglich keine signifikanten Unterschiede zwischen diesen beiden Methoden zu 
erwarten sind, kann die Hypothese diskriminierender Validität für 88% der be- 
trachteten Fälle angenommen werden. Eine differenzierte Analyse der Ausnah- 
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men deutet darauf hin, daß zwischen allen drei Teilstichproben keine signifikan- 
ten Abweichungen hinsichtlich der Eigenschaft „Marke“ auftreten. Dieses Er- 
gebnis ist vor allem in Hinblick auf Prüfung der Prognosevalidität positiv zu be- 
werten, denn damit sinkt die Gefahr, daß die Ergebnisse des Methodenvergleichs 
durch systematische Unterschiede hinsichtlich der Präferenzen für die betrachte- 
ten Marken zwischen den unabhängigen Stichproben verzerrt werden. Weiterhin 
auffallend ist die relativ hohe Übereinstimmung zwischen den Ergebnissen der 
CCC-alt und der CHIC-alt. Dies läßt vermuten, daß sich trotz methodischer Un- 
terschiede zwischen den beiden Verfahren vergleichbare Präferenzstrukturen er- 
geben. Alle übrigen nicht signifikanten Unterschiede weisen auf keine weiteren 
systematischen Effekte hin, so daß diese als Ausnahmen zu interpretieren sind, 
für deren Auftreten die Ergebnisse keine plausiblen Begründungen liefern. 

Während bisher die untersuchten Eigenschaften jeweils separat betrachtet wur- 
den, soll die diskriminierende Validität in einem weiteren Schritt durch die 
gleichzeitige Berücksichtigung aller Eigenschaften getestet werden. Hierfür wird 
der Korrelationskoeffizient nach Pearson zwischen den Mittelwerten der ge- 
schätzten Bedeutungsgewichte berechnet.^^^ Dieser gibt Auskunft darüber, in- 
wieweit sich die relative Wichtigkeit der 8 Eigenschaften zueinander zwischen 
den verschiedenen Verfahren unterscheiden. Die Ergebnisse dieser ebenfalls 
paarweisen Betrachtung sind in Tabelle 5-4 zusammengefaßt. 



Ein ähnliches Vorgehen zur Überprüfung der Korrespondenz zwischen den ermittelten 
Bedeutungsgewichten bei unterschiedlichen Verfahren berichten Akaah/Korgaonkar 
(1983). Die Autoren berechnen die Korrelationen zwischen den Bedeutungsgewichten je- 
doch zunächst auf individueller Basis und aggregieren die Ergebnisse anschließend. Dies 
ist allerdings nur möglich, wenn ein within-subject Design bei der Datenerhebung verwen- 
det wurde. In der vorliegenden Untersuchung ist aufgrund der unabhängigen Stichproben 
zwischen den drei hybriden Verfahren eine entsprechende individuelle Analyse nicht für 
alle paarweisen Vergleiche durchführbar. Ein weiterer Unterschied zu dem Vorgehen von 
Akaah/Korgaonkar (1983) liegt darin, daß die Autoren den Rangkorrelationskoeffizienten 
nach Spearman berechnen (vgl. S. 1 19). Dieser vergleicht jedoch nur die Reihenfolge der 
geschätzten Wichtigkeiten. Mit dem Korrelationskoeffizient nach Pearson werden dagegen 
auch die Unterschiede zwischen den verschiedenen Bedeutungsgewichten berücksichtigt 
und die Präferenzstrukturen detaillierter analysiert. 
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Tabelle 5-4: Korrelationskoeffizienten nach Pearson zwischen den Mittelwerten 



der Bedeutungsgewichte 



Me- 

thode 


ACA 


CCC- 

alt 


CCC- 

neu 


CHIC- 

alt 


CHIC- 

neu 


SE- 

ACA 


SE- 

CCC 


SE- 

CHIC 


ACA 




0,71** 


0,57 


0,68* 


0,62 


0,63* 


0,45 


0,47 


CCC- 

alt 






0,92*** 


0,85*** 


0,87*** 


0,37 


0,70* 


0,69* 


CCC- 

neu 






— 


0,76** 


0,89*** 


0,19 


0,61 


0,64* 


CHIC- 

alt 










0,96*** 


0,66* 


0,89*** 


0,89*** 


CHIC- 

neu 










— 


0,49 


0,82** 


0,85*** 


SE- 

ACA 














0,75** 


0,75** 


SE- 

CCC 
















0,98*** 


SE- 

CHIC 



















* p < 0,1 ; ** p <0,05; *** p<0,01 



Ein erstes Ergebnis dieser Korrelationsanalyse betrifft die Self-Explicated- 
Verfahren. So tritt zwischen der SE-CCC und SE-CHIC mit 0,98 eine nahezu 
perfekte Korrelation zwischen den Bedeutungsgewichten auf und bestätigt dem- 
entsprechend die Hypothese konvergierender Validität zwischen identischen 
Methoden zur Präferenzmessung. Dagegen wirken sich die methodischen Unter- 
schiede der SE-ACA auf die Ergebnisse aus. Ihre Korrelation mit der Self- 
Explicated- Variante der CCC bzw. CHIC fällt deutlich niedriger aus. Vergleicht 
man die hybriden Verfahren untereinander, sind die Übereinstimmungen der bei- 
den neuen Verfahren mit den Ergebnissen der ACA sehr ähnlich. Deutlich höher 
fallen dagegen die Korrelationen zwischen den beiden neuen Methoden aus. Dies 
gilt sowohl hinsichtlich der beiden Varianten CCC und CHIC als auch hinsicht- 
lich der beiden Schätzverfahren. Letzteres entspricht dabei nicht den Ergebnissen 
bei separater Analyse der Eigenschaften. Während als Ergebnis der Verteilungs- 
tests signifikante Unterschiede zwischen den beiden Schätzver fahren „-alt“ und 
„-neu“ bei beiden neuen Methoden auftraten (vgl. hierzu Tabelle 5-3), korrelieren 
die Ergebnisse zwischen CCC-alt und -neu bzw. CHIC-alt und -neu im Gegen- 
satz dazu bei Betrachtung aller Eigenschaften simultan sehr hoch. 
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Die Überlegungen, die zur Modifikation des Schätzverfahrens führten, wurden in 
Kapitel 3.1.3 diskutiert. Das Ziel der neuen Berechnungsformel ist, die Teilnut- 
zenwerte von Nicht-Kerneigenschaften nach Kombination der Schätzergebnisse 
aus beiden Interviewphasen nicht wesentlich stärker einfließen zu lassen als ein- 
zelne Kemeigenschaften. Diese Modifikation gewinnt in den Fällen an Bedeu- 
tung, in denen einzelne Kerneigenschaften im Conjoint-Teil dominant werden. 
Während dies in einer vorangegangenen Studie mit Kaffee als Untersuchungsge- 
genstand vor allem für die Eigenschaften Preis und Marke zutraf, tritt dieser Ef- 
fekt im vorliegenden Datensatz in der Form nicht auf Eine mögliche Erklärung 
hierfür könnte der betrachtete Untersuchungsgegenstand liefern. In der vorlie- 
genden Untersuchung wurde mit Kühlschränken ein Gebrauchsgegenstand be- 
trachtet, bei dem vor allem funktionale Eigenschaften kaufrelevant sind. Im Ge- 
gensatz dazu stellt Kaffee ein kurzlebiges Konsumgut dar, bei dem die Schlüs- 
selinformationen Preis und Marke im Verhältnis zu anderen Eigenschaften von 
hervorragender Bedeutung sind.^^^ Dies verdeutlicht, daß die Struktur von Nach- 
fragerpräferenzen auch von der Produktart beeinflußt wird und demzufolge die 
Bedeutung der vorgeschlagenen Modifikation der Berechnungsformel vom be- 
trachteten Untersuchungsgegenstand abhängen kann. 

Als dritter Bereich sei der Zusammenhang zwischen den ermittelten Bedeutungs- 
gewichten der hybriden Verfahren und denen der Self-Explicated-Methoden 
analysiert. Es zeigt sich, daß die Korrelationen innerhalb der Stichproben für die 
ACA (0,63*) und CCC (0,7* bzw. 0,61) vergleichbare Werte annehmen. We- 
sentlich höher und zudem hoch signifikant konvergieren die Bedeutungsgewichte 
zwischen der SE-CHIC und der CHIC. Eine Erklärung für diese höhere Konver- 
genz zwischen den beiden Phasen im Gegensatz zur CCC kann darin liegen, daß 
durch die Verankerung der Choice-Sets zueinander auf Basis der Self-Explicated- 
Phase mehr Informationen in der Conjoint-Phase integriert werden als dies bei 
der CCC der Fall ist. Hier beschränkt sich die Verbindung zwischen Self- 
Explicated-Phase und der Conjoint-Phase auf die Identifikation der Kemeigen- 



Vgl. Hensel-Börner/Sattler (2000), S. 14. 

Empirische Belege hierfür liefern Bleicher (1983), S. 16; Böcker (1986), S. 543 ff; Jacoby/ 
Olson/Haddock (1971), S. 570 ff; Kroeber-Riel (1992), S. 281 ff; Rao/Sattler (1998) und 
Sattler (1991), S. 181. 
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schäften. Des weiteren wird deutlich, daß die Präferenzstrukturen zwischen 
hybriden Verfahren mit einer anderen Self-Explicated-Methode relativ gering 
miteinander korrelieren.^^® Dies impliziert, daß Vergleiche zwischen den adapti- 
ven hybriden Verfahren mit einer unabhängigen Self-Explicated-Methode Unter- 
schiede in den ermittelten Präferenzstrukturen aufweisen können. 

5.1.3 Zusammenfassung der Ergebnisse hinsichtlich der diskrimi- 
nierenden Validität 

Die diskriminierende Validität wurde für den vorliegenden Datensatz auf zwei 
verschiedenen Ebenen getestet. Zum einen lieferte das Verfahren CCC die Mög- 
lichkeit, den Einfluß der Gestaltung der Beurteilungsaufgabe auf die ermittelten 
Präferenzstrukturen zu untersuchen. Zum anderen wurde in diesem ersten Schritt 
der Validitätsprüfung getestet, ob die untersuchten Methoden zur Präferenzmes- 
sung zu unterschiedlichen Ergebnissen hinsichtlich der geschätzten Präferenz- 
strukturen für die befragten Personen führen. Wie bereits erläutert, kann die dis- 
kriminierende Validität als Voraussetzung für alle weiteren Validitätsvergleiche 
angesehen werden. Nur wenn sich Unterschiede in den ermittelten Präferenz- 
strukturen in Abhängigkeit der eingesetzten Verfahren ergeben, gilt es weiterhin 
zu testen, welches Verfahren die höchste Übereinstimmung mit den tatsächlichen 
Präferenzstrukturen der Probanden erreicht. 

Zentrale Ergebnisse sind: 

1 . Zwischen den geschätzten Präferenzstrukturen in Abhängigkeit von der Beur- 
teilungsaufgabe (Rangreihung oder Kaufwahrscheinlichkeitsabfrage) konnte 
keine diskriminierende Validität nachgewiesen werden. Ein Kolmogoroff- 
Smirnoff-Test auf Verteilungsunterschiede zeigte nur für 2 der 8 Eigenschaf- 
ten schwach signifikante Unterschiede, wohingegen bei allen andern Eigen- 
schaften die Hypothese auf Gleichheit in der Verteilung nicht abgelehnt wer- 
den konnte. Vor diesem Hintergrund werden bei allen weiteren Analysen le- 
diglich die Ergebnisse der CCC auf Basis der Rangdaten berücksichtigt. 



Vgl. hierzu auch die Argumentation hinsichtlich der Häufigkeiten der Gewichtungsfakto- 
ren Wj* in Kapitel 4.3.3. 

Einzige Ausnahme bildet hierbei die Konvergenz zwischen der CHIC mit der SE-CCC. 
Dies ist jedoch plausibel, da die beiden Self-Explicated-Verfahren SE-CCC und SE-CHIC 
identisch sind und, wie bereits diskutiert, sehr hoch miteinander korrelieren. 
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2. Die Bedeutungsgewichte auf aggregierter Ebene (Mittelwerte und Standar- 
dabweichung) deuten mit Ausnahme der CCC auf relativ homogene Präfe- 
renzstrukturen hin. So fallen die durchschnittlichen Bedeutungsgewichte so- 
wohl bei den adaptiven hybriden als auch bei den Self-Explicated- Verfahren 
für die 8 Eigenschaften vergleichsweise ähnlich aus. Die Standardabweichun- 
gen der ermittelten Mittelwerte deuten darauf hin, daß diese Homogenität bei 
den Self-Explicated- Verfahren wesentlich stärker ausgeprägt ist. 

3. Mit Hilfe eines Kolmogoroff-Smimoff-Tests auf Verteilungsunterschiede 
konnte bei separater Analyse der einzelnen Eigenschaften gezeigt werden, daß 
bei individueller Betrachtung in überwiegender Mehrzahl signifikante Unter- 
schiede zwischen den Methoden auftreten. Die einzige Ausnahme zwischen 
SE-CCC und SE-CHIC bestätigt gleichzeitig, die konvergierende Validität bei 
identischen Verfahren. 

4. Über die Korrelation der aggregierten Mittelwerte der Bedeutungsgewichte 
wurden bei ebenfalls paarweiser Gegenüberstellung der Verfahren alle Eigen- 
schaften simultan berücksichtigt. Mit diesem Kriterium werden die Befunde 
der individuellen Analyse auf Basis des Verteilungstests nur bedingt bestätigt. 
Die konvergierende Validität zwischen SE-CCC und SE-CHIC zeigt sich 
auch hier durch eine fast perfekte Korrelation zwischen den mittleren Bedeu- 
tungsgewichten. Abweichend ergibt sich jedoch eine relativ hohe Konvergenz 
zwischen den alternativen Schätzverfahren bei der CCC und bei der CHIC. 
Als eine Erklärung wurden die vergleichbaren Bedeutungsgewichte aller Ei- 
genschaften angeführt, die zumindest teilweise auf Besonderheiten des Unter- 
suchungsgegenstandes zurückzuführen sind. Hinsichtlich der Korrelationen 
zwischen den adaptiven Verfahren und den Self-Explicated- Varianten kann 
keine eindeutige Aussage getroffen werden. Während die Ergebnisse der 
ACA und der CCC relativ niedrig mit den Self-Explicated- Varianten korrelie- 
ren, weist die CHIC signifikante Korrelationskoeffizienten bei der SE-CHIC 
und der SE-CCC auf Als ein Grund hierfür wurde die stärkere Verknüpfung 
der Informationen aus dem Conjoint-Teil mit denen der Self-Explicated-Phase 
genannt. Insgesamt ist diesen Teilergebnissen jedoch ein geringeres Gewicht 
beizumessen, da die individuelle Analyse einen höheren Aussagegehalt liefert. 

Die Überprüfung der diskriminierenden Validität ergab, daß keine signifikanten 

Unterschiede in Abhängigkeit der Präferenzabfrage bei der CCC auftreten. Für 
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die untersuchten adaptiven Methoden und den jeweiligen Self-Explicated- 
Verfahren sind auf individueller Ebene signifikante Unterschiede zwischen den 
geschätzten Präferenzstrukturen festzustellen. Anhand weiterer Gütekriterien 
muß deshalb überprüft werden, ob und inwieweit sich die Unterschiede auf die 
Prognosen, basierend auf den geschätzten Präferenzstrukturen, auswirken. 
Gleichzeitig wird damit untersucht, mit welcher der untersuchten Methoden die 
tatsächlichen Präferenzstrukturen der Probanden am besten erfaßt werden kön- 
nen. 

5.2 Interne Validität 

Wie in Kapitel 2 ausgeführt, wird mit der internen Validität die Korrespondenz 
zwischen den empirisch erhobenen Präferenzdaten und den auf Basis der ge- 
schätzten Nutzenwerte ermittelten Präferenzdaten getestet. Überprüft wird, ob 
und wie gut sich die Inputdaten (empirisch beobachtet) durch die geschätzten 
Outputdaten rechentechnisch rekonstruieren lassen.^^' Die interne Validität er- 
möglicht damit eine Aussage über die Güte des Modells an sich. Für die im Rah- 
men dieser Arbeit untersuchten Verfahren kann diese Überprüfung auf zwei Stu- 
fen durchgeführt werden. Sowohl für die CCC als auch für die CHIC kann zu- 
nächst die interne Validität im Hinblick auf die LINMAP bzw. OLS-Schätzung 
innerhalb der Conjoint-Phase ermittelt werden.^®^ Anschließend bezieht sich die 
Analyse für alle drei adaptiven Verfahren auf die Übereinstimmung zwischen 
beobachteten und geschätzten Werten der abhängigen Variable für das Kalibrie- 
rungsset. Die Ergebnisse dieser zweistufigen Überprüfung der internen Validität 
werden im folgenden dokumentiert. 

Das Gütemaß für die LINMAP-Schätzung der CCC bildet der Korrelations- 
koeffizient nach Kendall. Er wird berechnet zwischen der empirisch beobachteten 
Rangfolge in der Conjoint- Aufgabe und der auf Basis geschätzter Nutzenwerte 
errechneten Rangfolge für die Produktkonzepte. Nach dem gleichen Prinzip wird 
die interne Validität für die OLS-Schätzung der Conjoint-Phase der CHIC ge- 
messen. Hier wird jedoch der Korrelationskoeffizient nach Pearson herangezo- 
gen, da die abhängige Variable der geschätzten Regression metrisches Skalenni- 



Vgl. Baier/Säuberlich (1997), S. 968. 

Für die ACA sieht das System selbst kein vergleichbares Gütekriterium für die Schätzung 
innerhalb der Paarvergleichsaufgabe vor und kann auch nicht auf Basis des Interviewpro- 
tokolls im nachhinein ermittelt werden. 
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veau aufweist. Für beide Verfahren ergeben sich vergleichbare Wertebereiche 
hinsichtlich ihrer Gütekriterien. So ergibt sich für die individuellen Kendalls 
T-Werte der LINMAP- Schätzung ein Mittelwert von 0,77 (SA=0,21). Für die 
OLS-Schätzung der Conjoint-Phase der CHIC liegt der durchschnittliche Korre- 
lationskoeffizient nach Pearson für die Stichprobe bei 0,79 (SA=0,13). Eine di- 
rekte Gegenüberstellung dieser beiden Gütekriterien für die interne Validität ist 
jedoch nur bedingt zulässig. Zum einen unterscheiden sich die beiden Parameter 
hinsichtlich des Skalenniveaus der Inputdaten. Zum anderen hängen beide von 
der Anzahl der Beobachtungen ab. Während bei der CCC für alle Probanden 9 
Beobachtungen in die Schätzung eingingen, variiert die Anzahl der CHIC in Ab- 
hängigkeit der individuellen Kerneigenschaften zwischen 8 und 12 Beobachtun- 
gen. 

Wie bereits oben erwähnt, kann die interne Validität für die adaptiven hybriden 
Verfahren CCC, CHIC und ACA anhand des Kalibrierungssets getestet werden. 
Ermittelt wird hierfür die Übereinstimmung zwischen beobachteter Bewertung 
des Kalibrierungssets und deren Schätzungen auf Basis der kombinierten Teilnut- 
zenwerte. Die Vergleichbarkeit zwischen den drei Verfahren ist jedoch aus den 
bereits diskutierten Gründen eingeschränkt, denn neben dem Skalenniveau der 
Präferenzdaten variiert insbesondere die Größe des Kalibrierungssets und damit 
verbunden die Anzahl der Beobachtungen zwischen 4 (CHIC), 6 (ACA) und 9 
(CCC). Die Mittelwerte der jeweiligen Gütemaße sind in Tabelle 5-5 ausgewie- 
sen. Darüber hinaus werden bei der CCC und CHIC die Werte angeführt, die sich 
bei separater Betrachtung der Self-Explicated-Phase und der Conjoint-Phase er- 
geben. Entsprechend der in Kapitel 2.2.2. 1 vorgenommenen Abgrenzung der ver- 
schiedenen Gütekriterien, handelt es sich in diesem Fall nicht um eine Betrach- 
tung der internen Validität im engeren Sinn. Vielmehr kann damit überprüft wer- 
den, ob und inwieweit die Kombination der beiden Phasen zu einer höheren 
Übereinstimmung zwischen geschätzten und prognostizierten Werten für das Ka- 
librierungsset führt.^®^ 



Auch hier weist die ACA die entsprechenden Informationen und Werte nicht aus, so daß 
ein Vergleich nicht vorgenommen werden kann. 
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Tabelle 5-5: Mittelwerte (MW) und Standardabweichungen (SA) der Korre- 



lationskoeffizienten zwischen prognostizierten und beobachteten 
Werten des Kalibrierungssets 



CCC 


CHIC 


ACA 




Kendall 


Pearson 


Pearson 




MW (SA) 


MW (SA) 


MW (SA) 


SE- 




0,49 


SE- 


0,64 






CCC 




(0,24) 


CHIC 


(0,49) 






CA- 




0,57 


CA- 


0,48 


ACA 


0,60 


CCC 




(0,28) 


CHIC 


(0,52) 


(0,26) 


CCC 


0,68 

(0,25) 


CHIC 


0,82 

(0,39) 







Tabelle 5-5 zeigt, daß bei beiden neuen Methoden die Kombination der Self- 
Explicated- und der Conjoint-Phase zu einer höheren Übereinstimmung fuhrt als 
die jeweils separate Auswertung der beiden Phasen. Dieses Ergebnis war zu er- 
warten, da das interne Validitätsmaß als Zielkriterium für die Kombination der 
beiden Phasen herangezogen wurde. Interessant jedoch ist, daß, obwohl die Vali- 
dierung in einer wiederholten Conjoint- Aufgabe vorgenommen wird, bei der 
CHIC die Prognose durch die Schätzwerte der Self-Explicated-Phase besser ge- 
lingt als durch die Conjoint-Phase. Darüber hinaus ist die Überlegenheit der Self- 
Explicated-Phase gegenüber der Conjoint-Phase mit einem Anstieg von 0,64 (SE- 
CHIC) gegenüber 0,48 (CA-CHIC) doppelt so groß als im umgekehrten Fall bei 
der CCC. Hier kann zwar für die Conjoint- Werte eine höhere Übereinstimmung 
zwischen prognostizierten und beobachteten Werten festgestellt werden, aller- 
dings fällt dieser Unterschied zwischen 0,57 (CA-CCC) und 0,49 (SE-CCC) 
deutlich geringer aus als im umgekehrten Fall bei der CHIC. Ein Kolmogoroff- 
Smirnoff-Test ergab, daß die Unterschiede zwischen den Ergebnissen der einzel- 
nen Phasen hoch signifikant (p<0,01) sind.^®"^ In der Tendenz zeigte sich dieses 
Ergebnis bereits bei der Analyse der optimalen Gewichtungsfaktoren Wj* in Ka- 
pitel 4.3.3. Bei der CCC trat vergleichsweise häufig ein Gewichtungsfaktor nahe 
1 auf, wodurch die Conjoint-Teilnutzen die entscheidende Größe für die kombi- 
nierten Teilnutzenwerte bilden. Dagegen traf genau der umgekehrte Fall bei der 
CHIC zu. Dort lag bei fast 20% der Probanden der optimale Gewichtungsfaktor 



Auf einen T-Test auf Mittelwertunterschiede wurde verzichtet, da bei allen die Anwen- 
dungsvoraussetzung der Normalverteilung nicht gegeben war. 



149 




nahe 0.^®^ Die Ergebnisse in Tabelle 5-5 zeigen weiterhin, daß die interne Vali- 
dität insgesamt bei der CHIC mit 0,82 am höchsten ausfällt. Die geringste Vali- 
dität weist die ACA mit einer durchschnittlichen Korrelation von 0,6 zwischen 
beobachteten und prognostizierten Werten für das Kalibrierungsset auf, während 
die CCC mit einem Mittelwert von 0,68 zwischen den beiden anderen Verfahren 
liegt. Wie bereits erläutert, können diese Werte in ihrer absoluten Höhe nur be- 
dingt direkt miteinander verglichen werden. Ein Test auf Signifikanz der Unter- 
schiede zwischen den adaptiven Verfahren ist aus diesem Grund nicht sinnvoll. 
Die Überprüfung der internen Validität dient an dieser Stelle vielmehr einer Prü- 
fung der Modellgüte an sich und weniger einem Vergleich zwischen den ver- 
schiedenen Verfahren. 

Vor diesem Hintergrund muß diskutiert werden, daß die interne Validität sowohl 
bei den Auswertungen der Conjoint-Phase mit LINMAP und OLS als auch bei 
allen adaptiven Verfahren relativ niedrig ausfällt. Um sicherzustellen, daß infol- 
gedessen die Gesamtergebnisse insbesondere durch den Einfluß von Ausreißern 
nicht verzerrt werden, wurde eine entsprechende Sensitivitätsanalyse durchge- 
fuhrt. Zu diesem Zweck wurden alle drei Teilstichproben zunächst um die Pro- 
banden reduziert, bei denen das individuelle Gütemaß für die interne Validität 
kleiner als 0,2 und in einem zweiten Schritt kleiner als 0,4 lag. Die Werte bezie- 
hen sich sowohl auf die interne Validität der Schätzergebnisse innerhalb der 
Conjoint-Phase bei der CCC und CHIC als auch auf die drei adaptiven Verfah- 
ren, gemessen an der Prognosegüte des Kalibrierungssets. Die jeweils verblei- 
bende Anzahl an Probanden in den Teilstichproben ist in Tabelle 5-6 wiederge- 
geben. 



Vgl. hierzu auch Tabelle 4-4, in der eine Häufigkeitsverteilung über die optimalen Ge- 
wichtungsfaktoren Wj* für alle Probanden bei der CCC und der CHIC angegeben wird. 
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Tabelle 5-6: Umfang der Teilstichproben nach Eliminierung 
von Ausreißern 



Methode 

Stichprobenumfang 


ccc 


CHIC 


ACA 


Gesamt- 

stichprobe 


N 


242 


234 


249 


Stichprobe bei einem 
Grenzwert für das 
interne Gütemaß 
bei 0,2 


N 


225 


217 


220 


Stichprobe bei einem 
Grenzwert für das 
interne Gütemaß 
bei 0,4 


N 


205 


213 


178 



Um die Stabilität der Gesamtergebnisse hinsichtlich der Probanden mit sehr ge- 
ringer interner Validität zu testen, diente ein Kolmogoroff-Smirnoff-Test auf 
Verteilungsunterschiede zwischen den Bedeutungsgewichten für jede Eigen- 
schaft. Auch hier wurden die geschätzten Präferenzstrukturen betrachtet, da sie 
die Grundlage für alle weiteren Analysen und Validitätsvergleiche bilden.^^^ Bei 
jedem Verfahren wurde die Gesamtstichprobe (max) jeweils mit den um die Aus- 
reißer reduzierten Stichproben (0,2 und 0,4) verglichen. Für alle durchgeführten 
Verteilungstests ergab sich, daß nach Eliminierung von Probanden mit niedriger 
interner Validität keine signifikanten Unterschiede (p>0,l) zwischen der Ge- 
samtstichprobe und den jeweils reduzierten auftreten. Dies trifft bei allen Metho- 
den hinsichtlich aller 8 Eigenschaften gleichermaßen zu. Die mangelnde Ver- 
gleichbarkeit der internen Gütemaße bedeutet allerdings gleichzeitig, daß die ge- 
wählten Grenzwerte für Ausreißer nicht problemlos auf alle Verfahren übertrag- 
bar sind. Eine Eliminierung von Probanden mit niedriger interner Validität ist 
demzufolge nur über ein hohes Maß an Subjektivität zu realisieren. Um eine da- 
durch verursachte Verzerrung zu vermeiden und da es auf das Gesamtergebnis, 
wie gesehen, keinen Einfluß hat, werden alle weiteren Analysen auf Basis der 
jeweiligen Gesamtstichprobe durchgeführt. Weiterhin wird durch die Berück- 
sichtigung aller Probanden sichergestellt, daß die Vergleichbarkeit der Stichpro- 



Vgl. hierzu auch die Argumentation in Zusammenhang mit der Überprüfung der diskrimi- 
nierenden Validität in Kapitel 5.1. 
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ben in ihrer demografischen Struktur erhalten bleibt. Auch das ist eine notwendi- 
ge Voraussetzung für die Gültigkeit des Verfahrensvergleichs. 



5.3 Prognosevalidität 

Ergebnis der diskriminierenden Validitätsprüfung war, daß verschiedene Metho- 
den zur Präferenzmessung zu unterschiedlichen Schätzergebnissen fuhren. Eine 
Aussage darüber, welche der untersuchten Methoden die tatsächlichen Präferenz- 
strukturen der Probanden am besten abbildet, kann jedoch noch nicht gemacht 
werden. Gleiches gilt für die Befunde der internen Validität, da die dort einge- 
setzten Gütemaße nur bedingt über die verschiedenen Methoden vergleichbar 
sind (vgl. hierzu Kapitel 5.2). Um jedoch eine entsprechende Aussage zu ermög- 
lichen, werden die Verfahren im folgenden hinsichtlich ihrer Prognosegüte ver- 
glichen. Entscheidendes Kennzeichen dieses Gütekriteriums ist, daß Präferenzen 
prognostiziert werden, die in keiner Phase der Datenauswertung in die Schätzung 
der Teilnutzenwerte eingehen. Üblicherweise werden den Probanden hierfür zu- 
sätzliche Produktkonzepte zur Beurteilung vorgelegt und zusätzliche Präferenzen 
der Probanden erhoben. Für die Validierung wird dabei angenommen, daß diese 
die tatsächlichen Präferenzen der Probanden zeigen und die untersuchten Metho- 
den danach beurteilt, wie gut diese Präferenzen vorhergesagt werden können.^^^ 
Die zusätzlich zu bewertenden Produktkonzepte werden auch Holdout-Konzepte 
bzw. als Holdout-Set bezeichnet. Zwar wird die Validierung der Ergebnisse an- 
hand von Holdout-Daten in der Literatur nicht eindeutig einem Gütemaß zuge- 
ordnet,^®^ dennoch basiert der größte Teil bisheriger Validitätsvergleiche auf die- 
ser Vorgehensweise.^^^ 

Zur Quantifizierung der Prognosevalidität werden nachstehend drei alternative 
Operationalisierungen angewendet, deren Ergebnisse im folgenden behandelt 
werden. 



Vgl. Johnson (1989), S. 273. 

Vgl. hierzu Kapitel 2.2.2. 1. 

Vgl. Green/Srinivasan (1990), S. 13; Wittink/Bergestuen (1999), S. 10; Sriniva- 
san/deMaCarty (1998), S. 2 sowie die Dominanz dieses Kriteriums im Literaturüberblick 
der vorliegenden Arbeit. 
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5.3.1 First-Hit-Rate 

Wie in Kapitel 4.3.4 beschrieben, bestand die Beurteilungsaufgabe der Probanden 
hinsichtlich der Holdout-Sets darin, die Rangfolge anzugeben, in der sie die 5 
Kühlschränke am ehesten kaufen würden. Um die Holdout-Aufgabe als simu- 
lierte Kaufentscheidung interpretieren zu können, wird zunächst lediglich die In- 
formation hinsichtlich des ersten Rangplatzes herangezogen. Dabei wird ange- 
nommen, daß die Probanden bei einer Kaufentscheidung das Produktkonzept 
auswählen würden, dem sie den ersten Rang zugeordnet haben. Diese simulierte 
Kaufentscheidung läßt sich als Maß für die Prognosevalidität der untersuchten 
Verfahren verwenden. Hierzu werden auf Basis der geschätzten Teilnutzenwerte 
für die 5 realen Angebote Gesamtnutzenwerte berechnet.^'® Mit der First-Hit- 
Rate wird für jede Methode getestet, ob dem Produkt mit dem höchsten progno- 
stizierten Gesamtnutzen auch tatsächlich der erste Rang zugeordnet wurde. In 
Tabelle 5-7 sind die entsprechenden Prozentsätze für die richtig prognostizierten 
Rangplätze ausgewiesen. Für alle acht untersuchten Methoden zeigt sich eine 
deutliche Abweichung von der Idealanpassung (100%). Vorangegangene Unter- 
suchungen betonen jedoch, daß eine solche 100%ige Anpassung für die Prognose 
des ersten Rangplatzes nicht zu erwarten ist.^‘‘ Dennoch zeigt sich, daß die er- 
mittelten Prozentwerte der First-Hit-Rate z.T. deutlich niedriger ausfallen als bei 
den angeführten bisherigen Untersuchungen. 



Da die Marke „Electrolux“ nicht als Ausprägung in den durchgeführten Conjoint- 
Interviews enthalten war, wurden Informationen aus dem abschließenden Interviewteil zur 
Markeneinschätzung herangezogen. Hierbei wurden die Probanden gebeten, zusätzliche 
Marken, die nicht als Ausprägung im eigentlichen Befragungsprogramm enthalten waren, 
auf einer Rating-Skala 0 bis 10 zu bewerten. Diese Vorgehensweise entsprach der ersten 
Phase der Self-Explicated-Aufgabe der hybriden Verfahren. Somit konnten die Teilnut- 
zenwerte für die Ausprägung „Electrolux“ nachträglich je nach vorgenommener Bewertung 
durch die Probanden inter- oder extrapoliert werden. 

Vgl. z.B. Goldberg (1980): [22%-32%], zitiert nach Green/Goldberg/Montemayer (1981), 
S. 39; Albers/Brockhoff (1985): [60%], S. 197; Mehta/Moore/Pavia (1992): [„...models 
predicted approximately half of the first choices correctly“], S. 473; Huber et al. (1993): 
[56%-70%], S. 110; Sattler (1994): [76%-79%], S. 37; Srinivasan/Park (1997): [64%- 
76%], S. 289; Hensel-Börner/Sattler (2000): [42%-57%] S. 16. 
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Tabelle 5-7: Ergebnisse der Prognosevalidität, gemessen durch die First-Hit- 
Rate 



Methode 


ACA 


CCC- 

alt 


ccc- 

neu 


CHIC- 

alt 


CHIC- 

neu 


SE- 

ACA 


SE- 

CCC 


SE- 

CHIC 


N 


249 


242 


242 


234 


234 


249 


242 


234 


First-Hit- 
Rate a) 


45,4% 


44,2% 


41,3% 


39,3% 


44,9% 


40,2% 


39,7% 


41,5% 


Verbesserung 
gegenüber dem 
Zufallsmodell 


31,8% 


30,3% 


26,6% 
** * 


24,1% 

*** 

1 


31,1% 

*** 


25,3% 


24,6% 

*** 


26,9% 

*** 



a) Angegeben wird der Anteil an Personen, bei denen für das auf Rang 1 bewertete Pro- 
dukt der erste Rang richtig prognostiziert wurde. 

*** p<0,01 



Die insgesamt beste Anpassung wird mit 45,4% bei der ACA erzielt. Die CCC-alt 
und CHIC-neu erreichen mit 44,2% bzw. 44,9% vergleichbare Werte. Alle ande- 
ren Verfahren schwanken mit 39,3% (CHIC-alt) und 41,5% (SE-CHIC) in einem 
relativ kleinen Intervall und weisen somit eine niedrigere Anpassung als die drei 
genannten hybriden Verfahren auf. Überraschend hierbei ist, daß die modifizierte 
Schätzmethode bei der CHIC die erwartete Verbesserung in der Prognosegüte 
bewirkt, bei der CCC dagegen die First-Hit-Rate für die neue Variante geringer 
ausfällt. Ein zusätzlicher Vergleich der Methoden gegenüber einem Zufallsmo- 
dell^'^ ergab, daß die Verbesserungen bei allen Methoden hoch signifikant 
(p<0,01) sind. 

Auch wenn ein direkter Vergleich der vorliegenden Ergebnisse mit den Befunden 
bisheriger Studien nicht unproblematisch ist, können die z.T. deutlichen Unter- 
schiede hinsichtlich der First-Hit-Rate nur bedingt durch Besonderheiten im Un- 
tersuchungsdesign erklärt werden. Ein Grund für die relativ niedrigen Anpassun- 
gen kann vielmehr in mangelnder Reliabilität der Antworten liegen.^ Sofern 
Probanden bei einer Wiederholung der Beurteilungsaufgabe anders geantwortet 
haben als im eigentlich Conjoint-Interview, können dadurch deutliche Abwei- 

Zufallsmodell: Wahrscheinlichkeit, daß die Prognose für den ersten Rang mit der tatsächli- 
chen Entscheidung übereinstimmt. Für die vorliegende Untersuchung beträgt diese Wahr- 
scheinlichkeit 20%, da im Holdout-Set insgesamt 5 Produkte zu bewerten waren. 
Prozentuale Verbesserung = 100* [(korrekte Prognose durch die Präferenzmeßmethode in 
Prozent - korrekte Prognose durch das Zufallsmodell in Prozent) / (100 - korrekte Progno- 
se durch das Zufallsmodell in Prozent)]. Vgl. Srinivasan/Park (1997), S. 289. 
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chungen in den Prognoseergebnissen auftreten. Eine mögliche Ursache für solch 
inkonsistentes Antwortverhalten kann die Positionierung der Holdout-Aufgabe 
im Interviewablauf sein. Die erneute Abfrage der Präferenzen am Ende des Ge- 
samtinterviews birgt die Gefahr, die Auskunftsbereitschaft der Probanden zu 
überfordern und die Gültigkeit der gegebenen Antworten dadurch einzuschrän- 
ken. Weiterhin kann nicht ausgeschlossen werden, daß die Bewertungen für das 
Holdout- Set davon beeinflußt wurden, daß die Produktalternativen nur durch 5 
der untersuchten 8 Eigenschaften beschrieben waren. Insbesondere bei Proban- 
den, bei denen die nicht berücksichtigten Eigenschaften maßgeblich für die 
Kaufentscheidung sind, kann dies die Gefahr willkürlicher Antworten vergrößert 
haben. 

Die beobachteten Unterschiede in der First-Hit-Rate zwischen den Methoden 
wurden durch einen Vergleich der Parameter zweier Binomialverteilungen zu- 
sätzlich auf Signifikanz getestet.^ Die Irrtumswahrscheinlichkeiten für die Test- 
größe dieses paarweise durchgeführten x^-Tests sind in Tabelle 5-8 angegeben. 



Tabelle 5-8: Irrtumswahrscheinlichkeiten p der x^-Tests auf Signifikanz der 
Unterschiede zwischen der First-Hit-Rate 



Me- 

thode 


ACA 


CCC- 

alt 


ccc- 

neu 


CHIC- 

alt 


CHIC- 

neu 


SE- 

ACA 


SE- 

CCC 


SE- 

CHIC 


ACA 




p=0,79 


p=0,36 


p-0,18 


p-0,91 


p-0,24 


p=0,20 


p=0,38 


CCC- 

alt 






p-0,52 


p-0,28 


p=0,89 


p=0,36 


p=0,31 


p=0,54 


CCC- 

neu 








p=0,79 


p=0,43 


p-0,79 


p=0,71 


p=0,98 


CHIC- 

alt 










p=0,22 


p=0,85 


p=0,94 


p-0,64 


CHIC- 

neu 










— 


p=0,30 


p-0,25 


p-0,46 


SE- 

ACA 












— 


p=0,91 


p=0,77 


SE- 

CCC 
















p=0,69 


SE- 

CHIC 



















Vgl. Johnson (1989), S. 273. 
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Die paarweisen %^-Tests belegen, daß alle aufgetretenen Unterschiede zwischen 
den Verfahren in der First-Hit-Rate bei einer Irrtumswahrscheinlichkeit von 
p>0,10 nicht signifikant sind. Insgesamt kann den hybriden Verfahren (mit Aus- 
nahme der CHIC-alt) eine leicht höhere Prognosevalidität, gemessen durch die 
First-Hit-Rate, als den Self-Explicated-Verfahren bescheinigt werden. Es zeigt 
sich aber, daß diese Überlegenheit relativ gering ausfällt und zudem nicht signifi- 
kant ist. Dieses Ergebnis entspricht in seiner Tendenz den von Srinivasan/Park 
(1997) berichteten Befunden. Die Autoren können bei vergleichbarer Vorge- 
hensweise zur Operationalisierung der Prognosegüte keine signifikanten Unter- 
schiede zwischen der von ihnen vorgeschlagenen CCA und den Self-Explicated- 
Modellen nachweisen.^'^ 

5.3.2 Individuelle Kendalls x-Werte 

Wie bereits erläutert, bestand die Beurteilungsaufgabe für die Probanden hin- 
sichtlich des Holdout-Sets in der Rangreihung der 5 Produktalternativen, so daß 
die Prognosevalidität in einem nächsten Schritt auf Basis dieser zusätzlichen In- 
formationen überprüft werden kann. Hierfür wurde über die ermittelten Gesamt- 
nutzenwerte eine individuelle Präferenzrangfolge für jede Testperson bzgl. der 5 
Produkte abgeleitet, um diese mit der empirisch beobachteten Rangfolge verglei- 
chen zu können. Als Gütekriterium für die Übereinstimmung wurde der individu- 
elle Korrelationskoeffizient nach Kendall zwischen beiden Rangfolgen berechnet 
und für jedes Verfahren der Mittelwert über die entsprechende Teilstichprobe 
gebildet (vgl. Tabelle 5-9). 



Zur Vorgehensweise dieses Tests vgl. Hartung (1991), 496 ff 

Vgl. Srinivasan/Park (1997), S. 290. In ihrer Untersuchung ergibt sich für die Self- 
Explicated-Methode sogar eine leicht höhere First-Hit-Rate als für die CCA. Es sei zudem 
angemerkt, daß die Autoren den Vergleich nicht anhand eines zusätzlichen Holdout-Sets, 
sondern auf Basis tatsächlich getroffener Entscheidungen der Probanden durchführen. 
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Tabelle 5-9: Mittelwerte und Standardabweichungen der ermittelten Korrelati- 
onskoeffizienten (Kendalls x) zwischen beobachteter und progno- 
stizierter Rangfolge des Holdout-Sets 



Methode 


N 


Kendalls x 


Mittelwerte 


Standardab- 

weichungen 


ACA 


249 


0,32 


0,42 


CCC-alt 


242 


0,33 


0,40 


CCC-neu 


242 


0,33 


0,41 


CHIC-alt 


234 


0,26 


0,43 


CHIC-neu 


234 


0,27 


0,41 


SE-ACA 


249 


0,28 


0,41 


SE-CCC 


242 


0,28 


0,39 


SE-CHIC 


234 


0,29 


0,40 



Auffallend bei allen untersuchten Methoden ist, daß die durchschnittlichen Ken- 
dalls x-Werte sehr niedrig sind. Dies impliziert, daß die Prognose der Rangfolge 
für das Holdout-Set auf Basis der geschätzten Teilnutzenwerte im Mittel nur un- 
zureichend gelingt. Die hohen Standardabweichungen deuten zudem darauf hin, 
daß die Ergebnisse bei allen Methoden sehr stark um diese Mittelwerte streuen. 
Auch wenn andere Autoren vergleichbar niedrige Werte hinsichtlich dieses Güte- 
kriteriums nennen,^ stützen die Ergebnisse die Vermutung, daß Reliabilitätspro- 
bleme im Rahmen der Holdout-Aufgabe aufgetreten sind. Wie bereits im Zu- 
sammenhang mit der First-Hit-Rate erläutert, können dadurch die Prognoseer- 
gebnisse der einzelnen Verfahren beeinträchtigt werden. Eine weitere mögliche 
Erklärung für die extrem niedrigen Korrelationen zwischen prognostizierten und 
beobachteten Rangfolgen für das Holdout-Set kann darin liegen, daß die schriftli- 
che Erfassung der Antworten, im Gegensatz zur PC-gestützten bei allen anderen 
Interviewphasen, die Ergebnisse beeinflußt hat. Im schlechtesten Fall können 
organisatorische Fehler bei der Datenerhebung z.B. in der Zuordnung der schrift- 



Vgl. Goldberg (1980), zitiert nach Green/Goldberg/Montemayer (1981), S. 39; 
Akaah/Korgaonkar (1983), S. 192 und Green/Shaffer/Patterson (1991), S. 313. Einschrän- 
kend muß jedoch angemerkt werden, daß nur in der Studie von Akaah/Korgaonkar (1983) 
mit 6 Stimuli ein ähnlich großes Holdout-Set prognostiziert wurde. In den beiden anderen 
Untersuchungen umfaßte die Holdout-Aufgabe mit 9 bzw. 12 deutlich mehr Stimuli, wo- 
durch ein direkter Vergleich der Ergebnisse nur bedingt zulässig ist. 
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liehen Fragebögen zu den PC-Interviews aufgetreten sein. So vermuten bei- 
spielsweise auch Akaah/Korgaonkar (1983) aufgrund der sehr niedrigen Progno- 
següte für das Holdout-Set in ihrer Studie „some noise in the data“.^'^ 

Trotz dieser sehr niedrigen Prognosevalidität in ihrer absoluten Höhe, gemessen 
durch die individuellen Kendalls i-Werte, läßt sich als weiteres Ergebnis fest- 
halten, daß für alle 8 untersuchten Methoden die Mittelwerte über die Ge- 
samtstichproben nahezu gleich ausfallen. Dies bestätigen auch die Kolmogoroff- 
Smimoff-Tests auf Verteilungsunterschiede der individuellen Kendalls x-Werte 
zwischen den Methodenpaaren. In Tabelle 5-10 sind die kritischen Irrtumswahr- 
scheinlichkeiten p für die jeweilige Teststatistik ausgewiesen. 



Tabelle 5-10: Ergebnisse der Kolmogoroff-Smirnoff-Tests auf Unterschiede in 
den Verteilungen der individuellen Kendalls x-Werte für das Hol- 
dout-Set 



Me- 

thode 


ACA 


ccc- 

alt 


ccc- 

neu 


CHIC- 

alt 


CHIC- 

neu 


SE- 

ACA 


SE- 

CCC 


SE- 

CHIC 


ACA 


— 


p=0,99 


o 

o 


p=0,14 


p-0,23 


p-0,76 


p=0,ll 


p=0,93 


CCC- 

alt 






p=l,00 


p=0,15 


p=0,52 


p-0,73 


p-0,32 


p=0,84 


CCC- 

neu 








p-0,22 


p=0,48 


p=0,87 


p=0,27 


p-0,89 


CHIC- 

alt 










p=l,00 


p-0,69 


p=0,86 


p=0,86 


CHIC- 

neu 












p=l,00 


p=0,97 


p=0,86 


SE- 

ACA 














p=0,94 


O 

O 


SE- 

CCC 
















p-0,61 


SE- 

CHIC 



















Die Ergebnisse in Tabelle 5-10 unterstreichen, daß die Nullhypothese gleicher 
Verteilungen bei allen Paarvergleichen nicht abgelehnt werden kann (p>0, 1 ) und 
folglich keine signifikanten Unterschiede zwischen den Methoden auftreten. Die- 
ses zweite Ergebnis ist vor allem für den Vergleich der Methoden von zentraler 



Akaah/Korgaonkar (1983), S. 195. 
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Bedeutung. Es läßt vermuten, daß im Falle nicht beobachtbarer Einflüsse, z.B. 
aufgrund der Durchführung der Datenerhebung, das relative Abschneiden der 
verschiedenen Methoden nicht systematisch verzerrt wurde. Sind Reliabilitäts- 
probleme hauptsächlich für die niedrige Prognosevalidität verantwortlich, kann 
angenommen werden, daß diese zumindest im Mittel bei allen drei Stichproben in 
vergleichbarem Umfang aufgetreten sind. Andernfalls wären wesentlich größere 
Unterschiede zwischen den verschiedenen Methoden zu beobachten. Vor dem 
Hintergrund dieses zweiten Ergebnisses kann davon ausgegangen werden, daß 
die Aussagen hinsichtlich des Verfahrensvergleichs trotz der niedrigen Prognose- 
güte aller Methoden zumindest in ihrer Tendenz bestehen bleiben können. 

Die bisherigen Ergebnisse der individuellen^’^ Gütekriterien zur Prognosevalidi- 
tät deuten daraufhin, daß sich die in Kapitel 5.1 ebenfalls auf individueller Ebene 
nachgewiesenen signifikanten Unterschiede zwischen den ermittelten Präferenz- 
strukturen nicht auf die Prognosegüte der untersuchten Verfahren auswirkt. 
Vielmehr kann bei individueller Auswertung der Daten des Holdout-Sets ge- 
schluß folgert werden, daß die verschiedenen Verfahren zu vergleichbaren Ergeb- 
nissen hinsichtlich der Prognosevalidität fuhren. 

5.3.3 Simulierte Marktanteile 

Die Bewertung des Holdout-Sets durch die Probanden ermöglicht neben einer 
individuellen Analyse auch die Bestimmung simulierter Marktanteile der be- 
trachteten Marken. Die beobachteten Marktanteile ergeben sich aus der Anzahl 
an Probanden, die einer Marke den ersten Rangplatz zugeordnet haben. Wird auf 
Basis der geschätzten Teilnutzenwerte zudem eine Prognose der Marktanteile 
vorgenommen, liefert ein Vergleich dieser mit den empirisch beobachteten eine 
weitere Möglichkeit, jetzt auf aggregierter Ebene, zur Überprüfung der Progno- 
sevalidität. Voraussetzung für die Prognose der entsprechenden Marktanteile ist 



318 

Auch wenn bei der First- Hit- Rate der Anteil der Personen betrachtet wird, bei denen die 
Prognose übereinstimmt, gehen dabei die Informationen Jedes einzelnen Probanden ein. 
Für jeden wird individuell überprüft, ob die Prognose für den ersten Rangplatz mit dessen 
tatsächlicher Bewertung übereinstimmt. Im Gegensatz dazu wird bei der folgenden Be- 
trachtung simulierter Marktanteile nicht mehr jeder Proband einzeln analysiert, sondern die 
Teilstichprobe als ganzes betrachtet. Insofern kann die First-Hit-Rate als individuelles Gü- 
tekriterium für die Prognosevalidität interpretiert werden (vgl. hierzu auch Huber et al. 
(1993), die von „...individual hit rates...“ sprechen (S. 109) und Wittink/Bergestuen (1999), 
S. 11). 
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eine Transformation der geschätzten Gesamtnutzenwerte in Kaufwahrscheinlich- 
keiten. In der Literatur werden diesbezüglich alternative Kaufverhaltensmodelle 
vorgeschlagen, die im folgenden kurz erläutert werden. 

5.3.3.1 Kaufverhaltensannahmen^'^ 

Auf Basis eines Kaufverhaltensmodells wird festgelegt, wie die geschätzten Ge- 
samtnutzenwerte in Kaufwahrscheinlichkeiten transformiert werden. Eine solche 
Transformation ist erforderlich, da der geschätzte Gesamtnutzen ein Konstrukt 
darstellt, um die Präferenzen der Probanden zu quantifizieren. Er läßt in der Form 
noch keine Aussage hinsichtlich der Kaufwahrscheinlichkeit für eine Produktal- 
ternative zu. Eine der einfachsten Kaufverhaltensannahmen ist das sog. First- 
Choice-Model,^^^ welches implizit bereits bei der Überprüfung der First-Hit-Rate 
verwendet wurde: 



• First-Choice-Rule oder Maximale-Nutzenregel 



(5-1) Pim = 



l;wenn 
0; sonst 



MAX{Ui||l eM} 



(IgI; meM) 



wobei: 

pin^: Kaufwahrscheinlichkeit für die m-te Alternative für den 

i-ten Probanden, 

Uimi Geschätzter Gesamtnutzen für die m-te Alternative für 
den i-ten Probanden, 

I: Indexmenge der Probanden, 

M: Indexmenge der Alternativen. 



Nach dem First-Choice-Model wird die Produktalternative mit einer Wahr- 
scheinlichkeit von 100% gewählt, die unter den zur Verfügung stehenden Alter- 
nativen den höchsten Gesamtnutzen aufweist. Alle anderen Alternativen erhalten 
eine Kaufwahrscheinlichkeit von 0%. Die Vorteile des First-Choice-Model liegen 
vor allem in seiner konzeptionellen wie auch schätztechnischen Einfachheit. 



Einen sehr guten Überblick über die verschiedenen Kaufverhaltensannahmen geben 
Green/Krieger (1988). 

Vgl. Finkbeiner (1988), S. 78. 

Vgl. Green/Krieger (1988), S. 1 16. 
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Gleichzeitig neigt diese Transformationsvorschrift allerdings dazu, die Kauf- 
wahrscheinlichkeiten für attraktivere Produkte zu überschätzen, wohingegen für 
weniger attraktive die Kaufwahrscheinlichkeit unterschätzt wird.^^^ Dieser 
Nachteil gewinnt insbesondere dann an Bedeutung, wenn die Unterschiede zwi- 
schen den geschätzten Gesamtnutzen relativ gering sind. In diesem Fall erhält ein 
Produkt mit nur geringem Mehrnutzen gegenüber den anderen Alternativen eine 
Kaufwahrscheinlichkeit von 100%.^^^ Dieser Punkt macht deutlich, daß das First- 
Choice-Model voraussetzt, daß die Schätzung der Teilnutzenwerte verzerrungs- 
frei und ohne Schätzfehler gelingt.^^"^ 

Im Gegensatz dazu werden bei alternativen Kaufverhaltensmodellen die Kauf- 
wahrscheinlichkeiten konkurrierender Produktalternativen entsprechend ihrer 
geschätzten Gesamtnutzen aufgeteilt. Dabei wird berücksichtigt, daß nicht mit 
Sicherheit erwartet werden kann, welche der Produktalternativen ausgewählt wird 
und demzufolge auch Produkte mit geringerem Gesamtnutzen eine Kaufwahr- 
scheinlichkeit größer 0% aufweisen. Ferner wird auch der Tatsache Rechnung 
getragen, daß Probanden nicht immer das Produkt mit dem höchsten Nutzen aus- 
wählen bzw. gar keine eindeutige „erste Wahl“ haben.^^^ Dies trifft vor allem bei 
kurzlebigen Konsumgütern zu.^^^ Für die Bestimmung der Kaufwahrscheinlich- 
keiten unter Berücksichtigung der geschätzten Gesamtnutzenwerte liefert die Li- 
teratur alternative Modellierungsformen, die sich formal wie folgt darstellen las- 
sen: 

• Bradley-Terry-Luce-Kaufwahrscheinlichkeit (BTL-Model)^^^ 

Uj». 

(5-2) Pi^= (i£l;m£M) 

IgM 



Vgl. Curry (1998), S. 2. 

Vgl. hierzu auch Gutsche (1995), S. 142 f. 

Vgl. Elrod/Kumar (1989), S. 260. 

Vgl. Curry (1998), S. 2. Auch Elrod/Kumar (1989) führen im Zusammenhang mit den 
Nachteilen des First-Choice-Model als bereits bekanntes Phänomen an, daß die Probanden 
nicht immer die meist präferierte Alternativen auswählen (vgl. S. 260). 

Vgl. Green/Krieger ( 1 988), S. 1 1 8. 

Vgl. Green/Krieger (1988), S. 1 15 f 
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• Exponentiell gewichtete Kaufwahrscheinlichkeit^^^ 



(5-3) Pin, 



ZUi," 

leM 



(iel; msM) 



• Logit-Kaufwahrscheinlichkeit^^^ 



(5-4) Pim = ^e^'' (ieI;mGM) 

leM 



Diese drei KaufVerhaltensregeln implizieren, daß sich ein höherer Gesamtnutzen 
eines Produkts in einer entsprechend höheren Kaufwahrscheinlichkeit nieder- 
schlägt. Weiterhin wird sichergestellt, daß sich die Kaufwahrscheinlichkeiten 
über alle betrachteten Alternativen zu 1 addieren.^^® Als nachteilig dagegen ist 
insbesondere für das BTL- und das Logit-Modell die Besonderheit zu bewerten, 
daß sich häufig für alle betrachteten Alternativen relativ ähnliche Kaufwahr- 
scheinlichkeiten ergeben. Dadurch steigt bei Hinzunahme zusätzlicher Alternati- 
ven mit ähnlichen Gesamtnutzen die Kaufwahrscheinlichkeit für diese überpro- 
portional an.^^' Ausgeglichen werden kann dieser Effekt durch das exponentiell 
gewichtete Modell anhand des Exponenten ß, denn je größer der Wert hierfür 
gewählt wird, desto stärker sind die Unterschiede in den ermittelten Kaufwahr- 
scheinlichkeiten für die konkurrierenden Alternativen ausgeprägt. Im Extremfall, 
d.h. für sehr große ß-Werte, nähert sich das exponentiell gewichtete Modell an 
das First-Choice-Model an.^^^ Wird dagegen der Exponent ß=l gesetzt, entspricht 
das exponentiell gewichtete Kaufverhaltensmodell dem BTL-Model.^^^ 

Auch wenn diese vier Kaufverhaltensannahmen nicht alle in der Literatur disku- 
tierten Modelle repräsentieren, so stellen sie sowohl in der Wissenschaft als auch 



Vgl. Green/Krieger (1988), S. 1 16. 

Vgl. auch Hahn (1997), S. 156. 

Vgl. Curry (1998), S. 3. 

Zu den Problemen der BTL- und der Logit-Regel vgl. Green/Krieger (1988), S. 116. 

Vgl. Green/Krieger (1988), S. 1 16. 

Veranschaulichende Zahlenbeispiele zum Einfluß der Kaufverhaltensannahme auf die re- 
sultierenden Marktanteile gibt Curry (1998). 



162 




in der kommerziellen Anwendung die am häufigsten eingesetzten Modelle dar.^^"^ 
Die Diskussion der jeweiligen Vor- und Nachteile macht aber bereits deutlich, 
daß nicht a priori bestimmbar ist, welchem Modell der Vorzug gegeben werden 
kann.^^^ Aus diesem Grund wurden zur Prognose der Marktanteile die angeführ- 
ten Modelle alternativ verwendet. Für das exponentiell gewichtete Modell wur- 
den unterschiedliche Wertebereiche für ß angenommen, da keine eindeutige a 
priori Festlegung vorgenommen werden kann. Vielmehr gilt es, den Exponenten 
ß zu bestimmen, bei dem die höchste Übereinstimmung zwischen prognostizier- 
ten und beobachteten Marktanteilen erzielt werden kann. Als Wertebereiche für ß 
werden drei Intervalle betrachtet, die in jeweils kleinere Teilschritte untergliedert 
sind. Es sind dies Wertebereiche zwischen (0,1; 0,2; ...;1); (2;3; ...;10) und (20; 
30; ...; 100), in denen ß systematisch variiert. 

Die simulierten Marktanteile wurden somit für alle untersuchten Methoden zur 
Präferenzmessung unter Annahme von insgesamt 30 verschiedenen KaufVerhal- 
tensmodellen prognostiziert.^^^ Ausgangspunkt war die Ermittlung der individu- 
ellen Kaufwahrscheinlichkeiten für die 5 Alternativen des Holdout-Sets. Nach 
Aggregation dieser individuellen Werte liegt für jede der untersuchten Methoden 
eine Prognose der Marktanteile für die im Rahmen der Holdout-Aufgabe be- 
trachteten Marken vor. Wie bereits erwähnt, ergeben sich die empirisch beob- 
achteten Marktanteile aus der Anzahl der Probanden, die einer Marke in der Be- 
wertung der Holdout-Konzepte den ersten Rang zugeordnet haben. 

Gemessen wird die Prognosevalidität bei dieser aggregierten Betrachtung anhand 
von zwei Gütekriterien. Zunächst wurde der Korrelationskoeffizient nach Pear- 
son zwischen den 5 Marktanteilen berechnet. Damit wird jedoch lediglich erfaßt, 
wie gut die Relationen der unterschiedlichen Marken zueinander prognostiziert 
werden können. Abweichungen in der absoluten Höhe bleiben unberücksich- 
tigt.^^^ Aufgrund dieser für die Prognose von Marktanteilen eingeschränkten Aus- 



Vgl. hierzu auch Green/Krieger (1988), S. 115. 

Vgl. Green/Krieger (1988), S. 1 17 ff 

Angemerkt sei, daß lediglich vier verschiedene Kaufverhaltensmodelle im engeren Sinn 
verglichen wurden. Die Anzahl von 30 ergibt sich aus der Tatsache, daß für das exponenti- 
ell gewichtete Modell insgesamt 27 verschiedene Werte für den Exponenten ß angenom- 
men wurden. 

Dieser Effekt soll an einem einfachen Zahlenbeispiel veranschaulicht werden. Für die bei- 
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Sagefähigkeit des Korrelationskoeffizienten wurde zusätzlich die mittlere abso- 
lute Abweichung (MAA) zwischen den beobachteten und prognostizierten 
Marktanteilen ermittelt. Dieser Wert gibt Auskunft darüber, wie gut die Markt- 
anteile in ihrer absoluten Höhe prognostiziert werden können. Die Darstellung 
der Ergebnisse dieser aggregierten Validitätsprüfung ist im folgenden zweigeteilt. 
Zunächst wird für jede Methode das Kaufverhaltensmodell angenommen, bei 
dem die höchste Prognosevalidität, gemessen auf Basis von Pearson und der 
MAA, erzielt wird. In einem zweiten Schritt wird die Stabilität der Ergebnisse in 
Abhängigkeit der Kaufverhaltensannahme analysiert. 

5.3.3.2 Maximale Prognosevalidität der verschiedenen Methoden 

In Tabelle 5-11 sind für jedes Verfahren die maximalen Ausprägungen der beiden 
Gütekriterien Pearson und MAA ausgewiesen.^^^ Gleichzeitig wird dabei angege- 
ben, bei welcher Kaufverhaltensannahme sich dieser Maximalwert ergeben hat. 



den Zahlenreihen (1;2;3;4;5) und (10;20;30;40;50) ergibt sich ein Korrelationskoeffizient 
nach Pearson von 1, welcher eine perfekte Übereinstimmung impliziert. Keinen Einfluß 
hat, daß die Werte der zweiten Zahlenreihe um das Zehnfache größer sind als die der er- 
sten. 

Für die mittlere absolute Abweichung entspricht dieser „Maximalwert“ dem Minimum 
aller ermittelten Werte. 
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Tabelle 5-11: Maximale Übereinstimmungen zwischen beobachteten und 



prognostizierten Werten der simulierten Marktanteile gemes- 
sen durch Pearson und mittlere absolute Abweichung (MAA) 



Methode 


Pearson 


Kaufver- 

haltensmodell 


MAA in 
% 


Kaufver- 

haltensmodell 


ACA 


0,64 


exp. gew. Modell: 
ß=0,2 


5,9 


exp. gew. Modell: 
ß=3 


CCC-alt 


0,79 


exp. gew. Modell: 
ß=0,l 


5,5 


exp. gew. Modell: 
ß=6 


CCC-neu 


0,89** 


exp. gew. Modell: 
ß=0,l 


6,5 


exp. gew. Modell: 
ß=0,8;0,9;l,0 


CHIC-alt 


0,82* 


exp. gew. Modell: 
ß=0,3 


4,3 


exp. gew. Modell: 
ß=3;4 


CHIC-neu 


0,80 


exp. gew. Modell: 
ß=0,l 


4,3 


exp. gew. Modell: 
ß=5 


SE-ACA 


0,48 


exp. gew. Modell: 
ß=0,l 


7,2 


exp. gew. Modell: 
ß=2 


SE-CCC 


0,79 


exp. gew. Modell: 
ß=0,l 


6,1 


exp. gew. Modell: 
ß=2 


SE-CHIC 


0,75 


exp. gew. Modell: 
ß=0,2 


4,7 


exp. gew. Modell: 

ßz2 



*p<0,l;**p<0,05 



Die Ergebnisse in Tabelle 5-11 bestätigen, daß die beiden Gütekriterien Pearson 
und MAA zu unterschiedlichen Befunden führen können. Zieht man zunächst den 
Korrelationskoeffizienten Pearson zur Beurteilung heran, ergibt sich eine Über- 
legenheit für die CCC-neu. Sie weist mit 0,89 eine signifikante Korrelation 
(p<0,05) zwischen den beobachteten und prognostizierten Marktanteilen der si- 
mulierten Kaufsituation aus. Noch schwach signifikant (p<0,l) ist die Korrelation 
bei der CHIC-alt mit einem Wert von 0,82. Damit kann die Überlegenheit dieser 
beiden Methoden gegenüber allen anderen Varianten indirekt als (schwach) signi- 
fikant interpretiert werden. Während die neue Berechnungsformel bei der CHIC 
von untergeordneter Rolle ist, fuhrt sie bei der CCC zu einer Verbesserung der 
Prognosevalidität. Die ACA als drittes hybrides Verfahren schneidet bei diesem 
Gütekriterium deutlich schlechter ab. Die maximale Korrelation von 0,64 ist nicht 
nur niedriger als bei den beiden neuen hybriden Methoden, sondern zudem auch 
schlechter als bei den Self-Explicated- Varianten SE-CCC und SE-CHIC. Wäh- 
rend die Unterschiede dieser beiden Self-Explicated-Methoden zur jeweils hybri- 
den Vorgehensweise verhältnismäßig gering (bei der CCC-alt sogar gleich 0) 
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sind, fällt die Prognosevalidität der SE-ACA noch weiter ab. Sie weist mit 0,48 
die insgesamt und mit deutlichem Abstand geringste Übereinstimmung zwischen 
beobachteten und prognostizierten Werten auf. Zwar führt die Hinzunahme der 
Paarvergleichsaufgabe zu einer Erhöhung von 0,48 auf 0,64, jedoch liegt auch 
dieser Wert noch weit unter allen anderen Verfahren. 

Für ein Unternehmen ist die absolute Höhe des Marktanteils Jedoch von größerer 
Bedeutung als der relative Vergleich zur den Wettbewerbern. Damit kommt der 
MAA als Maß für die Prognosevalidität eine größere Bedeutung zu. Die Ergeb- 
nisse diesbezüglich zeigen, daß sich die geringsten Abweichungen für die CHIC- 
alt und CHIC-neu ergeben. Überraschend gut ist auch die Prognose der Self- 
Explicated- Variante der CHIC. Mit Ausnahme der SE-ACA, die auch hier wie- 
derum mit Abstand die geringste Prognosevalidität ausweist, ergeben sich für alle 
anderen Methoden vergleichbare Werte, aber durchweg höhere als bei der CHIC. 
Somit kann festgehalten werden, daß sich die relativen Ergebnisse der Methoden 
untereinander im Vergleich zu denen hinsichtlich des Korrelationskoeffizienten 
verändern. 

Für die vorgeschlagene Modifikation der Berechnungsformel ergibt sich ebenso- 
wenig ein eindeutiges Bild. Während die neue Berechnungsformel bei der CHIC 
keinen bzw. einen sehr geringen Einfluß auf das Ergebnis nimmt, fuhrt sie bei der 
CCC zu einer Erhöhung der MAA und dadurch zu einer Verschlechterung der 
Prognosevalidität. Wird die Prognosevalidität dagegen durch den Korrelations- 
koeffizienten nach Pearson quantifiziert, schneidet die CCC-neu besser ab als die 
CCC-alt. Somit sind die Befunde sowohl im Vergleich zwischen den beiden Ver- 
fahren als auch hinsichtlich alternativer Operationalisierungen der Gütekriterien 
widersprüchlich. 

Vergleicht man diese Befunde der simulierten Marktanteile mit der individuellen 
Analyse auf Basis der individuellen Kendall t-Werte und der First-Hit-Rate fällt 
auf, daß sich auf aggregierter Ebene zumindest teilweise (schwach) signifikante 
Unterschiede ergeben. Demgegenüber treten bei beiden individuell gemessenen 
Gütekriterien keinerlei signifikante Unterschiede zwischen den Methoden auf 



Vgl. hierzu die Ergebnisse in Kapitel 5.3.1 und 5.3.2. 



166 




Ursache hierfür können die bereits diskutierten Reliabilitätsprobleme sein. Sofern 
Probanden im Rahmen der Holdout-Aufgabe anders geantwortet haben als in der 
eigentlichen Conjoint- Aufgabe, was die geringen Mittelwerte für die individuel- 
len Kendalls x-Werte vermuten lassen, wirken sich diese Verzerrungen der Vali- 
ditätsergebnisse auf aggregierter Ebene geringer aus als auf individueller. Dem- 
zufolge können die Ergebnisse auch hinsichtlich der alternativen Gütekriterien 
voneinander abweichen, obwohl eigentlich das gleiche gemessen wird.^'^® 

In Tabelle 5-11 ist weiterhin aufgefuhrt, unter welcher Kaufverhaltensannahme 
die jeweils maximale Prognosevalidität ermittelt wurde. Für alle Methoden ist 
dies das exponentiell gewichtete Kaufverhaltensmodell. Unterschiede treten le- 
diglich in der Ausprägung des Exponenten ß auf Während bei Anwendung des 
Korrelationskoeffizienten der Exponent bei allen Verfahren nur zwischen 0,1 und 
0,3 schwankt, variiert dieser bei Bestimmung der MAA zwischen 0,8 (CCC-neu) 
und 6 (CCC-alt) bedeutend stärker. Die wesentlich höheren ß-Werte bei der 
MAA deuten darauf hin, daß eine zu starke Gleichverteilung der Kaufwahr- 
scheinlichkeiten in ihrer absoluten Höhe, wie es insbesondere die BTL- und die 
Logit-Regel vornehmen, nicht den tatsächlich beobachteten Marktanteilen ent- 
spricht. Wie in Abschnitt 5.3.3. 1 angeführt, ergeben sich sowohl für das BTL- als 
auch für das Logit-Modell tendenziell für alle betrachteten Alternativen sehr 
ähnliche Kaufwahrscheinlichkeiten.^'^' Im vorliegenden Fall impliziert dies, daß 
für alle 5 betrachteten Angebote eine Kaufwahrscheinlichkeit und den daraus 
abgeleiteten Marktanteil von näherungsweise 20% ermittelt wird. Ein Vergleich 
der beobachteten Marktanteile in den drei Teilstichproben zeigt jedoch, daß die 
tatsächlichen Werte (vgl. Tabelle 5-12) deutlich von dieser Gleichverteilung zwi- 
schen den Angeboten abweichen. Da dieser Effekt mit steigendem Exponenten ß 
beim exponentiell gewichteten Modell ausgeglichen werden kann, liefert diese 
Eigenschaft des Modells eine mögliche Erklärung für die deutlich höheren ß- 
Werte bei Analyse der MAA gegenüber einer Operationalisierung durch den Kor- 
relationskoeffizienten nach Pearson. 



Vgl. Wittink/Bergestuen (1999), S. 1 1 f 

Es sei noch einmal daraufhingewiesen, daß das BTL-Model dem exponentiell gewichteten 
Modell mit einem Exponenten ß=l entspricht. 
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Tabelle 5-12: Beobachtete Marktanteile (in %) im 



Rahmen der simulierten Kaufentscheidung 



Stichprobe 


ACA 


ccc 


CHIC 


Angebot 1 


28,9 


31,4 


29,9 


Angebot 2 


13,7 


21,9 


19,7 


Angebot 3 


28,9 


25,6 


24,4 


Angebot 4 


7,2 


7,4 


9,4 


Angebot 5 


21,3 


13,6 


16,6 



Für die „optimalen“ ß-Exponenten zeigt sich weiterhin, daß diese nicht nur über 
die verschiedenen Methoden schwanken, sondern auch bei jedem Verfahren 
selbst zwischen den beiden Gütekriterien Pearson und MAA variieren. In einem 
weiteren Schritt der Auswertung wird deshalb untersucht, inwieweit die Ergeb- 
nisse hinsichtlich der Prognosegüte von den unterstellten Kaufverhaltensannah- 
men abhängig sind. 

S.3.3.3 Einfluß der Kaufverhaltensannahme auf die Prognosevalidität 

Für den Vergleich der jeweils maximalen Prognosegüte für die alternativen Me- 
thoden wurde jeweils die Kaufverhaltensannahme herangezogen, bei der sich die 
höchste Übereinstimmung zwischen prognostizierten und empirisch beobachteten 
Werten der simulierten Marktanteile ergab. Damit ist jedoch zunächst nur ein Teil 
der Ergebnisse berichtet worden. Ebenso von zentraler Bedeutung ist, inwieweit 
die Prognoseergebnisse von der Wahl der Kaufverhaltensannahme beeinflußt 
werden. Während kein Zweifel darüber besteht, das die Kaufverhaltensannahme 
einen Einfluß hat,^"^^ ist noch unklar wie stark die Prognoseergebnisse davon ab- 
hängen. Insbesondere ist für den Validitätsvergleich der Methoden entscheidend, 
ob das relative Abschneiden der Verfahren durch die Wahl der Kaufverhaltens- 
annahme verändert wird. Diese Fragestellung ist bisher in der Literatur vernach- 
lässigt worden, denn häufig werden nur die Ergebnisse unter Annahme einer 
Kaufverhaltensannahme berichtet.^"^^ In der vorliegenden Untersuchung wird da- 
her die Sensibilität der Prognoseergebnisse hinsichtlich der Kaufverhaltensan- 
nahme explizit analysiert. 



Vgl. Green/Krieger (1988), S. 1 15. 

Vgl. Agarwal/Green (1991), S. 144; Huber et al. (1993), S. 109; Pullman/Dodson/Moore 
(1999), S. 131 f 
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In den beiden folgenden Tabellen sind die ermittelten Werte für den Korrelati- 
onskoeffizienten Pearson und die MAA bei allen 30 verschiedenen Modellierun- 
gen der Kaufverhaltensannahme aufgeführt. Die jeweils optimalen Werte aus 
Tabelle 5-11 im vorangegangenen Kapitel sind hervorgehoben. Weiterhin sind 
am Ende der Tabelle der Mittelwert, sowie Maximum und Minimum des jeweili- 
gen Gütekriteriums angegeben. Die Analyse dieser Ergebnisse kann Aufschluß 
darüber geben, wie stark die erzielte Prognosevalidität auf aggregierter Ebene 
von der Wahl der Kaufverhaltensannahme beeinflußt wird. 
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Tabelle 5-13: Korrelationskoeffizienten (Pearson) zwischen beobachteten und 
prognostizierten Werten der simulierten Marktanteile bei unter- 
schiedlichen Kaufverhaltensmodellen 



Pearson 


ACA 


ccc- 

alt 


ccc- 

neu 


CHIC- 

alt 


CHIC- 

neu 


SE- 

ACA 


SE- 

CCC 


SE- 

CHIC 


Kaufverhaltensmodelle 


FC a) 


0,43 


0,67 


0,63 


0,65 


0,53 


0,43 


0,67 


0,67 


Logit 


0,62 


0,74 


0,69 


0,75 


0,74 


0,43 






p=0,l 


0,61 


0,79 


0,89** 


0,79 


0,80 


0,48 


0,79 


0,72 


P=0,2 


0,64 


0,76 


0,81* 


0,81* 


0,78 


0,42 


0,70 


0,75 


P=0,3 


0,63 


0,78 


0,79 


0,82* 


0,77 


0,43 


0,74 


0,75 


p=0,4 


0,63 


0,76 


0,77 


0,78 


0,77 


0,39 


0,72 


0,74 


p=0,5 


0,62 


0,75 


0,74 


0,78 


0,76 


0,41 


0,72 


0,75 


P=0,6 


0,59 


0,76 


0,72 


0,77 


0,75 


0,40 


0,70 


0,74 


P=0,7 


0,58 


0,75 


0,69 


0,76 


0,75 


0,39 


0,69 


0,71 


p=0,8 


0,58 


0,75 


0,68 


0,77 


0,74 


0,39 


0,70 


0,71 


p=0,9 


0,58 


0,73 


0,67 


0,75 


0,74 


0,39 


0,69 


0,71 , 


p=l b) 


0,58 


0,73 


0,66 


0,75 


0,72 


0,39 


0,68 


0,70 


p=2 


0,55 


0,68 


0,59 


0,70 


0,67 


0,36 


0,64 


0,66 


P=3 


0,53 


0,65 


0,55 


0,68 


0,65 


0,36 


0,62 


0,64 


P=4 


0,51 


0,64 


0,55 


0,68 


0,65 


0,37 


0,61 


0,64 


P=5 


0,51 


0,64 


0,55 


0,68 


0,64 


0,38 


0,61 


0,64 


p=6 


0,50 


0,65 


0,55 


0,68 


0,64 


0,39 


0,61 


0,65 


ß=7 


0,50 


0,65 


0,55 


0,68 


0,65 


0,40 


0,62 


0,65 


ß=8 


0,49 


0,65 


0,55 


0,68 


0,65 


0,40 


0,62 


0,66 


ß=9 


0,49 


0,66 


0,55 


0,68 


0,65 


0,41 


0,62 


0,66 


ß=10 


0,49 


0,66 


0,56 


0,69 


0,65 


0,41 


0,63 


0,66 


ß=20 


0,47 


0,68 


0,58 


0,68 


0,64 


0,42 


0,65 


0,67 


ß=30 


0,46 


0,68 


0,59 


0,68 


0,64 


0,43 


0,66 


0,67 


ß=40 


0,46 


0,68 


0,60 


0,68 


0,64 


0,44 


0,67 


0,67 


ß=50 


0,45 


0,69 


0,60 


0,67 


0,63 


0,43 


0,67 


0,67 


ß=60 


0,45 


0,69 


0,61 


0,67 


0,63 


0,43 


0,67 


0,67 


ß=70 


0,45 


0,69 


0,61 


0,67 


0,63 


0,44 


0,67 


0,67 


ß=80 


0,45 


0,68 


0,61 


0,67 


0,63 


0,43 


0,67 


0,67 


ß=90 


0,44 


0,68 


0,61 


0,67 


0,63 


0,43 


0,67 


0,67 


ß=100 


0,44 


0,68 


0,61 


0,67 


0,63 


0,44 


0,67 


0,67 


MW 


0,52 


0,70 


0,64 


0,71 


0,68 


0,41 


0,67 


0,69 


MAX 


0,64 


0,79 


0,89 


0,82 


0,80 


0,48 


0,79 


0,75 


MIN 


0,43 


0,64 


0,55 


0,65 


0,53 


0,36 


0,61 


0,64 



* p<0,l;** p<0,05 



a) First-Choice-Model 

b) entspricht dem BTL-Model 
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Tabelle 5-14: Mittlere absolute Abweichungen (MAA in %) zwischen den beob- 
achteten und prognostizierten Werten der simulierten Marktanteile 
bei unterschiedlichen Kaufverhaltensmodellen 



MAA 


ACA 


ccc- 

alt 


ccc- 

neu 


CHIC- 

alt 


CHIC- 

neu 


SE- 

ACA 


SE- 

CCC 


SE- 

CHIC 


Kaufverhaltensmodelle 


FCa) 


12,0 


10,7 


7,4 


12,5 


9,2 


18,3 


15,3 


15,6 


Logit 


7,4 


7,0 


7,1 


5,5 


5,5 


7,5 


6,9 


5,4 


P=0,1 


7,6 


7,4 


7,4 


5,6 


5,6 


7,6 


7,4 


5,6 


P=0,2 


7,4 


7,2 


7,3 


5,5 


5,6 


7,6 


7,2 


5,5 


p=0,3 


7,4 


7,0 


7,1 


5,4 


5,5 


7,5 


7,0 


5,4 


P=0,4 


7,3 


6,9 


7,0 


5,4 


5,4 


7,5 


6,7 


5,4 


p=0,5 


7,2 


6,7 


6,8 


5,3 


5,4 


7,5 


6,5 


5,3 


P=0,6 


7,1 


6,5 


6,7 


5,3 


5,3 


7,4 


6,5 


5,2 


p=0,7 


7,1 


6,4 


6,6 


5,2 


5,3 


7,4 


6,4 


5,2 


P=0,8 


7,0 


6,3 


6,5 


5,1 


5,2 


7,4 


6,3 


5,1 


P=0,9 


6,9 


6,3 


6,5 


5,1 


5,2 


7,4 


6,3 


5,0 


p=l b) 


6,9 


6,2 


6,5 


5,0 


5,1 


7,3 


6,3 


5,0 


p=2 


6,3 


6,0 


6,7 


4,6 


4,9 


7,2 


6,1 


4,7 


p=3 


5,9 


5,9 


6,9 


4,3 


4,7 


7,6 


6,1 


4,9 


p=4 


6,5 


5,8 


7,0 


4,3 


4,5 


8,6 


6,6 


5,1 


p=5 


7,0 


5,6 


7,0 


4,7 


4,3 


9,4 


6,9 


6,0 


p=6 


7,5 


5,5 


7,0 


5,3 


4,7 


10,2 


7,4 


7,1 


p=7 


7,9 


6,0 


6,9 


6,0 


5,1 


11,1 


8,1 


8,1 


p=8 


8,3 


6,4 


6,9 


6,6 


5,6 


12,0 


8,7 


8,9 


p=9 


8,7 


6,8 


6,9 


7,2 


6,0 


12,8 


9,2 


9,7 


ß=10 


9,0 


7,1 


6,8 


7,7 


6,4 


13,5 


9,7 


10,3 


ß=20 


10,5 


9,4 


7,2 


10,4 


8,5 


16,6 


12,8 


13,5 


ß=30 


11,1 


10,2 


7,6 


11,4 


9,2 


17,4 


13,9 


14,6 


ß=40 


11,4 


10,5 


7,8 


11,8 


9,5 


17,7 


14,4 


15,0 


P=50 


11,5 


10,7 


7,9 


12,0 


9,7 


17,9 


14,6 


15,2 


ß=60 


11,7 


10,8 


7,9 


12,1 


9,9 


18,0 


14,8 


15,3 


ß=70 


11,7 


10,8 


7,9 


12,2 


9,9 


18,0 


14,9 


15,4 


ß=80 


11,8 


10,9 


7,9 


12,3 


9,9 


18,1 


15,0 


15,4 


ß=90 


11,8 


10,9 


7,9 


12,3 


10,0 


18,2 


15,0 


15,5 


ß=100 


11,8 


10,9 


7,9 


12,3 


10,0 


18,2 


15,1 


15,5 


MW 


8,7 


7,8 


7,2 


7,6 


6,7 


11,8 


9,6 


9,1 


MAX 


12,0 


10,9 


7,9 


12,5 


10,0 


18,3 


15,3 


15,6 


MIN 


5,9 


5,5 


6,5 


4,3 


4,3 


7,2 


6,1 


4,7 



a) First-Choice-Model 



b) entspricht dem BTL-Model 
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Die Verläufe beider Gütekriterien (vgl. Tabelle 5-13 und 5-14) zeigen bei allen 
acht Methoden, daß die Höhe der Übereinstimmung zwischen prognostizierten 
und beobachteten Werten je nach angenommenem Kaufverhaltensmodell variiert. 
Für den Korrelationskoeffizienten weist die CCC-neu mit einer Schwankungs- 
breite von 0,55 bis 0,89 die größten Unterschiede zwischen den Ergebnissen al- 
ternativer Kaufverhaltensregeln auf. Im Gegensatz dazu variiert die MAA bei 
diesem Verfahren nur zwischen 6,5 und 7,2 und weist die insgesamt geringsten 
Schwankungen bei diesem Gütekriterium auf. Dies bestätigt erneut, daß die bei- 
den Gütekriterien zu unterschiedlichen Ergebnisinterpretationen fuhren können. 
Ein möglicher Grund hierfür kann darin liegen, daß sich Änderungen der Kauf- 
verhaltensannahme stärker auf die relativen Unterschiede zwischen den ermittel- 
ten Marktanteilen (gemessen durch Pearson) als auf deren absolute Höhe (gemes- 
sen durch MAA) auswirken. Bei allen anderen Methoden schwankt die MAA 
deutlich stärker, wobei die Abweichungen bei den Self-Explicated-Methoden mit 
11,1% (SE-ACA) bis auf das achtfache (gegenüber der CCC-neu mit 1,4%) an- 
steigen. Darin wird deutlich, daß die Wahl der Kaufverhaltensannahme die Aus- 
prägung der Prognosevalidität maßgeblich determiniert. 

Vergleicht man die Ergebnisse über die verschiedenen Kaufverhaltensmodelle 
hinweg, ist außerdem festzustellen, daß auch das relative Abschneiden der Me- 
thoden unterschiedlich ausfällt. Um diese Divergenzen zu quantifizieren, werden 
die 8 Methoden zunächst entsprechend der Höhe jeweils bei beiden Gütemaßen 
in eine Rangfolge gebracht. So wird z.B. der CCC-neu (SE-ACA) unter Annah- 
me des First-Choice-Model der Rangplatz 1 (8) zugeordnet, da sie im Vergleich 
zu allen anderen Methoden mit 7,4% (18,3%) die geringste (höchste) MAA auf- 
weist (vgl. Tabelle 5-14). Über den Rangkorrelationskoeffizienten nach Kendall 
kann in einem nächsten Schritt überprüft werden, inwieweit diese Rangfolgen der 
Methoden bei den unterschiedlichen Kaufverhaltensmodellen übereinstimmen. 
Für die beiden Gütekriterien wurden entsprechend der 30 angewendeten Modelle 
insgesamt 435 Korrelationskoeffizienten (nach Kendall) berechnet.^'^'^ Nimmt die- 
ser Korrelationskoeffizient den Wert 1 an, so fuhren zwei unterschiedliche Kauf- 
verhaltensannahmen zum identischen relativen Abschneiden der 8 Methoden. Die 
Vergleiche zwischen allen Kaufverhaltensannahmen zeigen, daß dies nur in 6% 



Die Anzahl dieser paarweisen Vergleiche ergibt sich aus n(n-l)/2, wobei n für die Anzahl 
der angewendeten Kaufverhaltensmodelle (=30) steht. 
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aller Fälle zutrifft, sofern die Prognosegüte auf Basis der Korrelation nach Pear- 
son quantifiziert wird. Dient die MAA als Gütekxiterium, liegt der Prozentsatz 
mit 1 1% übereinstimmender Befunde nicht wesentlich höher. 

Wie stark die Ergebnisse und die Unterschiede zwischen den Verfahren in ihrer 
absoluten Höhe differieren, bleibt bei der Bestimmung der Rangplätze allerdings 
unberücksichtigt. Diese Überlegung soll an einem vereinfachten Beispiel ver- 
deutlicht werden (vgl. hierzu Tabelle 5-13). Für ß=0,l ergibt sich für die CHIC- 
neu (Pearson = 0,80) ein niedrigerer Rangplatz als für die CHIC-alt (Pearson = 
0,79). Das relative Abschneiden (gemessen an den Rangplätzen) kehrt sich in der 
nächsten Zeile (ß=0,2) genau um. Wird die Übereinstimmung nun anhand des 
Rangkorrelationskoeffizienten quantifiziert, bleibt unberücksichtigt, daß sich die 
absolute Höhe der Gütemaße bei beiden Verfahren lediglich um 0,02 verändert 
hat. Die Integration dieser Unterschiede in die Betrachtung erfolgte in einem 
zweiten Schritt über die Berechnung der Korrelationen zwischen dem relativen 
Abschneiden der Verfahren bei unterschiedlichen KaufVerhaltensannahmen mit 
dem Korrelationskoeffizient nach Pearson. Hierbei ergeben sich in 63% (Pear- 
son) bzw. 36% (MAA) der jeweils 435 Vergleiche Korrelationen über 0,9. Der 
Grad der Übereinstimmung zwischen den alternativen Kaufverhaltensmodellen 
fällt bei dieser Vorgehensweise z.T. wesentlich höher aus. Dennoch kann für die 
vorliegende Untersuchung wie erwartet festgehalten werden, daß alternative 
Kaufverhaltensannahmen zu unterschiedlichen Prognoseergebnissen führen kön- 
nen. Das in diesem Zusammenhang neue und wichtigere Ergebnis dieser Analyse 
ist, daß die Wahl der Kaufverhaltensannahme auch den relativen Verfahrensver- 
gleich beeinflußt. 

Welche Kaufverhaltensannahme zur höchsten Prognosevalidität führt und welche 
weniger geeignet ist, zeigt sich auf Basis der bisherigen Ergebnisse in der Ten- 
denz über alle Methoden einheitlich. Bereits in Kapitel 5. 3. 3. 2 bei der Gegen- 
überstellung der maximalen Werte für die Prognosevalidität wurde diskutiert, daß 
bei allen Methoden mit dem exponentiell gewichteten Modell die höchste Über- 
einstimmung erzielt wird. Auch die Wertebereiche für den gewählten Exponenten 
ß sind z.T. über die verschiedenen Methoden vergleichbar. Einheitlich über alle 
Methoden ist ebenfalls das schlechte Abschneiden des First-Choice-Model. Die- 
ser Befund entspricht den Ergebnissen von Huber et al. (1993). Die Autoren be- 
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richten, daß sich die First-Choice-Regel auch bei ihrer Studie mit Kühlschränken 
als Untersuchungsgegenstand als nicht geeignet zur Ableitung der Kaufwahr- 
scheinlichkeiten erwies. Dennoch widersprechen diese Befunde den erwarteten 
Vorteilen des Modells. Gerade für langlebige Gebrauchsgüter, erscheint das First- 
Choice-Model zumindest aus theoretischer Sicht als sehr geeignet.^^^ Eine Erklä- 
rung für die vorliegenden Befunde kann darin liegen, daß für einen Großteil der 
Probanden die Produktalternativen des Holdout-Sets in ihrer Attraktivität, gemes- 
sen durch die geschätzten Gesamtnutzen, sehr ähnlich sind. Wie in Kapitel 
5.3.3. 1 erläutert, kann das First-Choice-Model in diesen Fällen zu verzerrten Pro- 
gnoseergebnissen führen. 

5.3.4 Zusammenfassung der Ergebnisse hinsichtlich der Progno- 
sevalidität 

Die Prüfung der Prognosevalidität fußt auf Präferenzdaten, die über eine zusätzli- 
che Holdout-Aufgabe erhoben wurden. Diese sind auf der Grundlage der ge- 
schätzten Teilnutzenwerte prognostiziert und mit den empirisch beobachteten 
Werten verglichen worden. Die Übereinstimmung wurde dabei anhand unter- 
schiedlicher Gütekriterien gemessen. Als zentrale Ergebnisse können festgehalten 
werden: 

1 . Hinsichtlich der First-Hit-Rate weist die ACA, CHIC-neu und die CCC-alt die 
beste Prognosevalidität auf Sie führen alle drei zu sehr ähnlichen Werten für 
dieses Gütekriterium. Alle anderen Methoden schneiden etwas schlechter ab 
und variieren nur geringfügig untereinander. Insgesamt erweisen sich aber 
alle Unterschiede zwischen den Methoden als nicht signifikant. 

2. Analog zur First-Hit-Rate ergeben sich auch bei einem Vergleich der indivi- 
duellen Rangkorrelationen (Kendall) keine signifikanten Unterschiede zwi- 
schen den 8 untersuchten Methoden. Die Mittelwerte über alle Probanden va- 
riieren mit Werten von 0,26 (CHIC-alt) und 0,33 (CCC-alt bzw. CCC-neu) 
nur unbedeutend. Auffallend ist allerdings, daß die Rangkorrelationen in ihrer 
absoluten Höhe unerwartet niedrig ausfallen. 

3. Die Übereinstimmung zwischen beobachteten und prognostizierten Werten 
für die simulierten Marktanteile wurde sowohl durch die Korrelation (Pearson) 



Vgl. Huber et al.( 1993), S. 109. 

Vgl. Gutsche (1995), S. 142 f. und Green/Krieger (1988), S. 118. 
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als auch durch die mittlere absolute Abweichung (MAA) gemessen. Diese 
beiden Gütekriterien führen zu unterschiedlichen Befunden. Hinsichtlich des 
Korrelationskoeffizienten nach Pearson zeigt sich eine Überlegenheit für die 
CCC-neu. Während alle anderen Varianten der beiden neuen Verfahren CCC 
und CHIC, insbesondere auch deren Self-Explicated-Phasen niedrigere aber 
untereinander vergleichbare Ergebnisse aufweisen, schneiden die ACA und 
die SE-ACA schlechter ab. Eine höhere Aussagekraft liefert allerdings die 
MAA. Bei beiden Varianten der CHIC tritt mit 4,3% die geringste mittlere 
Abweichung auf, gefolgt von der SE-CHIC mit einer MAA von 4,7%. Alle 
anderen Verfahren schneiden schlechter ab, wobei die Unterschiede (mit 
Ausnahme der SE-ACA) auch hier vergleichsweise gering sind. 

4. Die Prognoseergebnisse auf aggregierter Ebene, gemessen durch simulierte 
Marktanteile, werden maßgeblich davon beeinflußt, welches Kaufverhaltens- 
modell zur Transformation der geschätzten Gesamtnutzenwerte in Kaufwahr- 
scheinlichkeiten bzw. Marktanteile angenommen wird. Sowohl die Prognose- 
validität der einzelnen Methoden in ihrer absoluten Höhe als auch das relative 
Abschneiden der Verfahren variiert in Abhängigkeit der Kaufverhaltensan- 
nahme. 

5. Auf individueller Ebene (First-Hit-Rate und individuelle Kendalls x- Werte) 
treten zwischen den untersuchten Methoden nur geringe, überwiegend nicht 
signifikante Unterschiede auf Somit wirkt sich die auf individueller Ebene 
nachgewiesene diskriminierende Validität nicht auf die Prognosegüte aus. 
Wird dagegen die Prognosevalidität auf aggregierter Ebene (simulierte Markt- 
anteile) überprüft, treten Unterschiede zwischen den Methoden auf, die sich 
jedoch für die CCC-neu und CHIC-alt als (schwach) signifikant erweisen. 

6. Über alle Operationalisierungen hinweg variieren die Befunde hinsichtlich der 
alternativen Schätz verfahren für die CCC und die CHIC. So ist weder zwi- 
schen den Verfahren eine eindeutige Tendenz erkennbar, noch innerhalb einer 
Variante bei einem Vergleich der unterschiedlichen Gütemaße. Die Modifi- 
kation der Berechnungsformel führt teilweise zu einer Erhöhung oder zu einer 
Reduzierung der Prognosevalidität sowohl bei der CCC als auch bei der 
CHIC. Die Ergebnisse der Prognosevalidität lassen damit keine eindeutige 
Aussage über den Effekt der neuen Berechnungsformel zu. 
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5.4 Externe Validität 

Alle bisherigen Validitätsprüfungen basieren auf Informationen, die im Rahmen 
der Interviews gewonnen wurden. Mit Blick auf die externe Validität der ver- 
schiedenen Methoden gilt es nun, in einem letzten Schritt zu testen, ob die bishe- 
rigen Befunde Bestand haben, wenn die auf Grundlage der Befragung prognosti- 
zierten Marktanteile mit realen Marktanteilen und damit mit von den befragten 
Stichproben unabhängigen Daten verglichen werden. Als Vergleichsgröße stan- 
den die realen Marktanteilsdaten des GfK-Handelspanel für das Jahr 1998 zur 
Verfügung.^^^ 

Obwohl die Prüfung der externen Validität durch einen Vergleich der Progno- 
seergebnisse mit realen Marktdaten das für die Praxis relevanteste Prüfkriterium 
für die Präferenzmeßmethoden darstellt, liegen bisher relativ wenige solcher Un- 
tersuchungen vor.^"^^ Wenn auch kein Zweifel über die Notwendigkeit von Vali- 
ditätsvergleichen in Zusammenhang mit realen Marktanteilen besteht,^"^^ über- 
rascht dieses bisherige Defizit solcher Studien in der Literatur kaum. Die Schwie- 
rigkeit liegt maßgeblich in der Übertragung der Marktanteilsprognosen auf Basis 
eines Conjoint-Interviews auf die reale Kauf- bzw. Marktsituation. Obgleich Ent- 
scheidungen im Rahmen eines Conjoint-Interviews immer unter Annahme einer 
tatsächlichen Kaufentscheidung getroffen werden, ist nicht sichergestellt, daß 
diese dem realen Kaufverhalten entsprechen. Erschwert wird die Übertragbarkeit 
durch weitere Einflüsse auf das Verhalten in der realen Kaufsituation. So hängt 
die tatsächliche Kaufentscheidung unter anderem von der Wirkung verschiedener 
Marketing-Mix-Instrumente wie Werbung und Distribution ab.^^^ Als weitere 
Einflußgrößen führen Wittink/Bergestuen (1999) die Dynamik des Marktgesche- 
hens oder das Auftreten zusätzlicher Marktteilnehmer an.^^’ Während die Markt- 



Für die Bereitstellung der Daten sei dem GfK-Panelservice, namentlich den Herren H.-J. 
Finck und Friedemann Stöckle an dieser Stelle Dank ausgesprochen. 

Einen Überblick über Studien, bei denen die externe Validität überprüft wurde, geben Le- 
vin et al. (1983), Louviere (1988) und Green/Srinivasan (1990), wobei die Autoren die ex- 
terne Validität hierbei nicht ausschließlich auf die Prognose realer Marktanteile beziehen, 
sondern beispielsweise auch um die Prognose tatsächlichen Entscheidungsverhaltens er- 
weitern. Diese erweiterte Definition der externen Validität entspricht der im Rahmen dieser 
Arbeit vorgenommenen Abgrenzung der Gütekriterien (vgl. hierzu Kapitel 2.2.2. 1). 

Vgl. Green/Srinivasan (1990), S. 13. 

Vgl. Srinivasan/deMaCarty ( 1 998), S. 1 . 

Vgl. Wittink/Bergestuen (1999), S. 8. 
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anteilsprognosen im Rahmen eines Conjoint-Interviews auf der Annahme basie- 
ren, daß die Probanden alle Produkte kennen und zudem alle in gleicher Weise 
verfügbar sind, kann beides in der realen Marktsituation über die Produkte variie- 
ren.^^^ 

Um den Einfluß dieser zusätzlichen Variablen ausklammern zu können, schlagen 
Srinivasan/deMaCarty (1998) vor, die Validierung der Prognoseergebnisse nicht 
auf Basis absoluter Verkaufszahlen vorzunehmen, sondern „nur“ deren Verhält- 
nisse hinsichtlich verschiedener Produkte zu prognostizieren. Die Autoren be- 
trachten hierfür die Situation einer Unternehmung, die mehrere Produkte in einer 
Produktkategorie anbietet. Unter Annahme eines vergleichbaren Zeithorizonts 
und gleich hohen Marketingaufwendungen für die verschiedenen Produkte, sind 
Daten wie z.B. Werbeaufwendungen, Distributionsquoten etc. für die Validierung 
nicht mehr erforderlich.^^^ Übertragen auf die vorliegende Studie impliziert die- 
ses Vorgehen, daß relative Verkaufszahlen verschiedener Modelle von Tisch- 
kühlschränken eines Herstellers zu prognostizieren sind. Da jedoch die Absatz- 
zahlen der verschiedenen Modelle in der Produktkategorie „Tischkühlschrank“ 
für die einzelnen Anbieter nicht Vorlagen, konnte das vorgeschlagene Verfahren 
zur Validierung nicht angewendet werden. Dennoch wird die Argumentation von 
Srinivasan/deMaCarty (1998) in der vorliegenden Validitätsprüfung aufgegriffen. 
Die Operationalisierung der Prognosevalidität als auch der externen Validität 
durch den Korrelationskoeffizient nach Pearson zwischen geschätzten und beob- 
achteten Marktanteilen mißt ebenfalls die relative Marktposition der verschiede- 
nen Anbieter. 

Um dennoch die externe Validität der untersuchten Verfahren überprüfen zu 
können, werden bei der Prognose realer Marktanteile entsprechende Kontextva- 
riablen wie Marketing-Mix-Instrumente integriert. Das hierfür angewendete 
Marktanteilsmodell wird im folgenden Abschnitt erläutert. 



Vgl. Srinivasan/deMaCarty (1998), S. 3. 
Vgl. Srinivasan/deMaCarty (1998), S. 4 ff. 
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5.4.1 Marktanteilsmodell 

Grundlage fiir die Marktanteilsprognose war folgendes in der Literatur und Praxis 
vielfach (in dieser oder leicht modifizierter Form) angewandte ModelP^'^: 

FR * RCt 

(5-5) MA„=DG„*X ® ^ (ieI;meM) 

i€l I 

wobei: 

MAm! Prognostizierter Marktanteil fiir das m-te Produkt, 

DGm: Distributionsgrad des m-ten Produkts, 

ERim: Erstkaufrate für das m-te Produkt des i-ten Probanden, 

BGimi Bekanntheitsgrad des m-ten Produkts beim i-ten Probanden, 

I: Indexmenge der Probanden, 

M: Indexmenge der Alternativen. 

In seiner Grundform berücksichtigt dieses Marktanteilsmodell zusätzlich die 
Wiederkaufrate und die Kaufintensität für das jeweilige Produkt. Da in der vor- 
liegenden Studie mit „Kühlschränken“ als Untersuchungsgegenstand ein langle- 
biges Gebrauchsgut betrachtet wurde, kommt diesen beiden Größen eine unterge- 
ordnete Rolle zu und wurden daher nicht in das Modell integriert. Eine Auswer- 
tung der im Rahmen der Befragung erhobenen Informationen zur Wiederkaufrate 
bzw. Kaufintensität bestätigt diese Vorgehensweise. In der vorliegenden Studie 
gaben lediglich 10,4% der 725 Probanden an, schon ein zweites Mal einen Kühl- 
schrank der gleichen Marke gekauft zu haben. Häufiger als zweimal wurde eine 
Marke von keinem der Probanden gekauft. 

Zur Umsetzung des Modells müssen die auf der rechten Seite der Gleichung (5-5) 
angegebenen Größen empirisch bestimmt werden. Für die Erstkaufrate wurde 
analog zur Vorgehensweise in Kapitel 5.3 die Kaufwahrscheinlichkeit für jede 



Vgl. Silk/Urban (1978), S. 177; Erichson (1979); S. 261 f; Hammann/Erichson (1994), S. 
378 ff; Gaul/Baier/Aperis (1996), S. 210. 
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der 4 betrachteten Marken abgeleitet.^^^ Hierfür wurden zunächst für alle ver- 
schiedenen Modelle von Tischkühlschränken der jeweiligen Hersteller die Ge- 
samtnutzenwerte berechnet. Der jeweils individuell höchste Gesamtnutzen einer 
Marke diente zur Bestimmung der Erstkaufrate.^^^ Die Transformation der Ge- 
samtnutzenwerte in Kaufwahrscheinlichkeiten wurde ebenfalls unter Annahme 
der verschiedenen Kaufverhaltensmodelle vorgenommenen. Die Bekanntheits- 
grade für die verschiedenen Marken wurden im Rahmen des Interviews indivi- 
duell durch direkte Befragung erhoben.^^^ Für die Distributionsgrade standen 
die aggregierten Daten des GfK-Handelspanel aller 4 untersuchten Marken für 
das Jahr 1998 zur Verfügung.^^^ 

Die Messung der externen Validität wird analog zur Prognosevalidität anhand des 
Korrelationskoeffizienten nach Pearson und der MAA vorgenommen. Dabei 
werden zunächst die Ergebnisse der maximalen externen Validität dargestellt. In 
einem zweiten Schritt wird geprüft, wie die Annahmen über das KaufVerhalten 
die Wertebereiche der beiden Gütemaße beeinflussen. 

5.4.2 Maximale externe Validität der verschiedenen Methoden 

Die maximalen Übereinstimmungen der verschiedenen Methoden zwischen pro- 
gnostizierten und beobachteten Werten für die realen Marktanteile sind in Tabelle 
5-15 wiedergegeben. 



Aus Gründen der Vergleichbarkeit zur Prognosevalidität sollten jeweils nur die Marken 
betrachtet werden, die auch in der simulierten Kaufentscheidung enthalten waren. Da eine 
dieser Marken jedoch nicht im GfK-Handelspanel berücksichtigt ist, wird die Marktan- 
teilsprognose an dieser Stelle nur für die verbleibenden 4 Marken des Holdout-Sets vorge- 
nommen. 

Diese Vorgehensweise war notwendig, da die Marktanteilsdaten nur für Tischkühlschränke 
insgesamt und nicht für die verschiedenen Modelle differenziert Vorlagen. 

Um Verzerrungen des Verfahrensvergleichs aufgrund unterschiedlicher Bekanntheitsgrade 
zwischen den befragten Teilstichproben zu vermeiden, werden die Bekanntheitsgrade je- 
weils über die drei Teilstichproben gemittelt. 

Dabei muß berücksichtigt werden, daß es sich um die Distributionsgrade für die gesamte 
Bundesrepublik handelte, wohingegen die Daten der vorliegenden Befragung mit der re- 
gionalen Begrenzung auf die drei Städte Hamburg, Frankfurt/Main und München erhoben 
wurden. Die direkte Übertragbarkeit der GfK-Daten auf die vorliegende Untersuchung ist 
insofern mit Einschränkungen in der Ergebnisinterpretation verbunden. 
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Tabelle 5-15: Maximale Übereinstimmungen zwischen beobachteten und 



prognostizierten Werten der realen Marktanteile gemessen 
durch Pearson und mittlere absolute Abweichung (MAA) 



Methode 


Pearson 


Kaufver- 

haltensmodell 


MAA in % 


Kaufver- 

haltensmodell 


ACA 


0,87 


exp. gew. Modell: 
ß=4;5;6;7 


4,8 


exp. gew. Modell: 
ß=5 


CCC-alt 


0,88 


exp. gew. Modell: 
ß=5;6;7;8;9;10 


4,4 


exp. gew. Modell: 
ß=5 _ 


CCC-neu 


0,94* 


exp. gew. Modell: 
ß=10 


3,8 


exp. gew. Modell: 
ß=6 


CHIC-alt 


0,88 


exp. gew. Modell: 
ß=6;7;8;9;10 


4,5 


exp. gew. Modell: 
ß=5 


CHIC-neu 


0,93* 


exp. gew. Modell: 
ß=8;9;10 


3,9 


exp. gew. Modell: 
ß=6 


SE-ACA 


0,82 


exp. gew. Modell: 
ß=0,8;0,9;l;2;3 


5,4 


exp. gew. Modell: 
ß=3 


SE-CCC 


0,83 


exp. gew. Modell: 
ß=3;4;5;6;7;8 


5,0 


exp. gew. Modell: 
ß=5 


SE-CHIC 


0,84 


exp. gew. Modell: 
ß=3;4;5;6;7 


5,0 


exp. gew. Modell: 

ßz4 



*P<0,1 



Im Vergleich zu den Ergebnissen hinsichtlich der simulierten Marktanteile in Ka- 
pitel 5.3 fällt zunächst auf, daß insbesondere die Korrelationskoeffizienten höher 
ausfallen. Dies impliziert indes nicht ausschließlich, daß hier eine höhere Progno- 
següte erzielt wird, sondern wird zumindest teilweise durch die geringere Anzahl 
an Beobachtungen (4 statt vorher 5 Marken) bedingt. Die Werte der MAA deuten 
darauf hin, daß die Prognose der realen Marktanteile verhältnismäßig gut gelingt. 
Bezüglich der beiden Gütekriterien (Korrelation nach Pearson und MAA) ergibt 
sich insgesamt eine Überlegenheit der beiden neuen Verfahren, wenn jeweils die 
neue Berechnungsformel angewendet wird. Lediglich bei diesen beiden Varian- 
ten ist eine (schwach) signifikante Korrelation zwischen den prognostizierten und 
beobachteten Marktanteilen festzustellen. Hinsichtlich der MAA weisen sie eben- 
falls die höchste Übereinstimmung auf Das Abschneiden der anderen Verfahren 
ist hinsichtlich beider Kriterien vergleichbar. Die ACA und die beiden neuen 
Methoden mit der „alten“ Berechnungsformel fuhren untereinander zu ähnlichen 
Ergebnissen. Alle Self-Explicated-Methoden weisen eine geringere externe Vali- 
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dität auf als alle hybriden Verfahren. Analog zu allen bisherigen Befunden fallt 
diese Unterlegenheit überraschend gering aus. 

Tabelle 5>15 belegt weiter, daß wiederum bei allen Methoden das exponentiell 
gewichtete Kaufverhaltensmodell am besten geeignet ist, die Gesamtnutzenwerte 
in Kaufwahrscheinlichkeiten zu transformieren. Im Vergleich zu den Befunden 
der Prognosevalidität sind hier jedoch wesentlich höhere Werte für den Expo- 
nenten ß anzunehmen. Eine Analyse der realen Marktanteile gibt eine Erklärung 
für diesen Unterschied. Die realen Marktanteile der untersuchten Marken diffe- 
rieren bei den realen Marktanteilsdaten wesentlich stärker als die im Rahmen der 
simulierten Kaufsituation beobachteten (vgl. hierzu Tabelle 5-12).^^^ Wie in Ka- 
pitel 5.3.3. 1 diskutiert, fallen mit steigendem Exponenten ß die Unterschiede 
zwischen den prognostizierten Marktanteilen bei der exponentiell gewichteten 
Kaufwahrscheinlichkeit größer aus. Den größeren Unterschieden in den realen 
Marktanteilen wird somit durch höhere Werte für ß Rechnung getragen. Inwie- 
weit die Ergebnisse der externen Validität von der jeweiligen Kaufverhaltensan- 
nahme abhängen, wird im zweiten Schritt durch Auswertung aller angewendeten 
Modelle getestet. 

5.4.3 Einfluß der Kaufverhaltensannahme auf die externe 
Validität 

Entsprechend der Vorgehensweise bei der Prognosevalidität in Abschnitt 5. 3. 3. 3 
wird auch an dieser Stelle überprüft, inwieweit die Ergebnisse hinsichtlich der 
externen Validität, insbesondere das relative Abschneiden der verschiedenen 
Methoden, davon abhängen, welche Kaufverhaltensannahme zur Transformation 
der Gesamtnutzenwerte herangezogen wird. Der Kaufverhaltensannahme spielt 
bei der Prognose realer Marktanteile eine zentrale Rolle. Vor diesem Hintergrund 
soll nun überprüft werden, inwieweit die Ergebnisse des Methodenvergleichs da- 
von beeinflußt werden. In den beiden folgenden Tabellen (vgl. Tabelle 5-16 und 
Tabelle 5-17) sind die Ergebnisse der beiden Gütekriterien Pearson und MAA 
dargestellt. 



359 



Aus Gründen der Geheimhaltung können die realen Marktanteile der untersuchten Marken 
nicht berichtet werden. 
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Tabelle 5-16: Korrelationskoeffizienten (Pearson) zwischen beobachteten und 
prognostizierten Werten der realen Marktanteile bei unterschiedli- 
chen Kaufverhaltensmodellen 



Methode 


ACA 


ccc - 

alt 


ccc - 

neu 


CHIC- 

alt 


CHIC- 

neu 


SE- 

ACA 


SE- 

CCC 


SE- 

CHIC 


Kaufverhaltensmodelle 


FC a) 


0,77 


0,77 


0,84 


0,81 


0,85 


0,61 


0,66 


0,68 


Logit 


0,82 


0,82 


0,82 


0,82 


0,82 






■yi 


ß=0,i 


0,81 


0,81 


0,81 


0,80 


0,81 




0,80 


0,80 


P=0,2 


0,81 


0,81 


0,81 


0,81 


0,81 


0,81 


0,80 


0,81 


P=0,3 


0,81 


0,81 


0,81 


0,81 


0,81 


0,81 


0,80 


0,81 


P=0,4 


0,81 


0,81 


0,82 


0,81 


0,81 


0,81 


0,81 


0,81 


P=0,5 


0,82 


0,81 


0,82 


0,81 


0,82 


0,81 


0,81 


0,81 


P=0,6 


0,82 


0,82 


0,82 


0,82 


0,82 


0,81 


0,81 


0,81 


P=0,7 


0,82 


0,82 


0,82 


0,82 


0,82 


0,81 


0,81 


0,81 


P=0,8 


0,82 


0,82 


0,83 


0,82 


0,82 


0,82 


0,81 


0,82 


P=0,9 


0,82 


0,82 


0,83 


0,82 


0,83 


0,82 


0,81 


0,82 


P=lb) 


0,83 


0,82 


0,83 


0,82 


0,83 


0,82 


0,81 


0,82 


P=2 


0,84 


0,84 


0,86 


0,84 


0,85 


0,82 


0,82 


0,83 


p=3 


0,86 


0,86 


0,88 


0,86 


0,87 


0,82 


0,83 


0,84 


P=4 


0,87 


0,87 


0,89 


0,87 


0,89 


0,81 


0,83 


0,84 


P=5 


0,87 


0,88 


0,91* 


0,87 


0,90* 


0,80 


0,83 


0,84 


p=6 


0,87 


0,88 


0,92* 


0,88 


0,91* 


0,78 


0,83 


0,84 


p=7 


0,87 


0,88 


0,92* 


0,88 


0,92* 


0,77 


0,83 


0,84 


p=8 


0,86 


0,88 


0,93* 


0,88 


0,93* 


0,75 


0,83 


0,83 


p=9 


0,86 


0,88 


0,93* 


0,88 


0,93* 


0,73 


0,82 


0,82 


ß=10 


0,85 


0,88 


0,94* 


0,88 


0,93* 


0,72 


0,82 


0,81 


ß=20 


0,81 


0,84 


0,93* 


0,84 


0,91* 


0,64 


0,76 


0,75 


ß=30 


0,79 


0,82 


0,91* 


0,82 


0,89 


0,62 


0,72 


0,72 


ß=40 


0,78 


0,80 


0,90 


0,81 


0,87 


0,61 


0,69 


0,71 


ß=50 


0,78 


0,79 


0,89 


0,80 


0,86 


0,61 


0,68 


0,70 


ß=60 


0,77 


0,79 


0,88 


0,80 


0,86 


0,61 


0,67 


0,69 


ß=70 


0,77 


0,78 


0,87 


0,80 


0,85 


0,61 


0,66 


0,69 


ß=80 


0,77 


0,78 


0,87 


0,80 


0,85 


0,61 


0,65 


0,68 


ß=90 


0,77 


0,78 


0,87 


0,80 


0,85 


0,61 


0,65 


0,68 


ß=100 


0,77 


0,78 


0,86 


0,80 


0,85 


0,61 


0,65 


0,68 


MW 


0,82 


0,82 


0,87 


0,83 


0,86 


0,74 


0,77 


0,78 


MAX 


0,87 


0,88 


0,94 


0,88 


0,93 


0,82 


0,83 


0,84 


MIN 


0,77 


0,77 


0,81 


0,80 


0,81 


0,61 


0,65 


0,68 



* p<0, 1 

a) First-Choice-Model 



b) entspricht dem BTL-Model 
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Tabelle 5- 17: Mittlere absolute Abweichungen (MAA in %) zwischen den beob- 
achteten und prognostizierten Werten der realen Marktanteile bei 
unterschiedlichen Kaufverhaltensmodellen 



Methode 


ACA 


ccc- 

alt 


ccc- 

neu 


CHIC- 

alt 


CHIC- 

neu 


SE- 

ACA 


SE- 

CCC 


SE- 

CHIC 


Kaufverhaltensmodelle 


FCa ) 


12,9 


14,6 


11,4 


12,8 


11,5 


20,3 


15,8 


17,1 




6,7 


6,6 


6,6 


6,6 


6,6 


6,7 


6,7 


6,7 


p=o,i 


6,9 


6,9 


6,9 


6,9 


6,9 


6,9 


6,9 


6,9 


p=0,2 


6,9 


6,9 


6,8 


6,9 


6,8 


6,9 


6,9 


6,9 


P=0,3 










6,8 


6,8 


6,9 


6,8 


P=0,4 












6,8 


6,8 


6,8 


P=0,5 












6,7 


6,8 


6,7 


P=0,6 












6,7 


6,7 


6,7 


P=0,7 












6,7 


6,7 


6,6 


P=0,8 












6,6 


6,7 


6,6 


P=0,9 








6,5 




6,6 


6,6 


6,5 


p=lb) 








6,5 




6,5 


6,6 


6,5 


P=2 






5,7 


5,9 


5,8 


6,0 


6,2 


6,0 


p=3 




5,3 




5,4 




5,4 


5,8 


5,5 


P=4 




4,8 


4,5 


4,9 


4,6 


5,9 


5,4 


5,0 


P=5 




4,4 




■E9 


4,0 


6,3 


5,0 


5,1 


P=6 




4,6 


Kiil 




3,9 


6,8 


5,2 


5,5 


p=7 




4,9 


3,9 


4,9 




7,2 


5,6 


6,0 


p=8 


HSI 


5,2 




5,2 


4,1 


7,7 


5,9 


6,3 


p=9 


IB9I 


5,4 


4,1 


5,4 


■9 


8,2 


6,3 


6,7 


ß=10 


■^1 




4,2 




4,3 


8,7 


6,6 


7,1 


ß=20 






wem 


7,4 


6,1 


13,4 


8,9 


9,3 


ß=30 






6,7 






16,6 


10,2 


11,7 


ß=40 






7,8 




9,5 


18,2 


11,8 


13,3 


ß=50 


UM 




8,6 






19,1 


13,0 


14,2 


ß=60 


UttiM 










19,7 


13,8 


14,9 


ß=70 






_ 9,5 






20,0 


14,3 


15,3 


ß=80 


MBkM 










20,2 


14,7 


15,7 


ß=90 


Mom 




■BW 


12,7 




20,3 


15,0 


15,9 


ß=100 


HeU 




Hifcl 






20,4 


15,2 


16,1 


MW 


7,9 


7,9 


6,6 


7,8 


7,1 


10,8 


8,6 


9,0 


MAX 


12,9 


14,6 


11,4 


12,8 


11,6 


20,4 


15,8 


17,1 


MIN 


4,8 


4,4 


3,8 


4,5 


3,9 


5,4 


5,0 


5,0 



a) First-Choice-Model 



b) entspricht dem BTL-Model 
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Vergleicht man jeweils die geringste (Minimum) und die höchste (Maximum) 
Übereinstimmung zwischen prognostizierten und realen Marktanteilen in Tabelle 
5-16 und Tabelle 5-17 wird deutlich, daß auch hier die Wahl der Kaufverhaltens- 
annahme einen entscheidenden Einfluß auf die Güte der Prognose hat. Auffallend 
ist, daß bei den drei Self-Explicated-Methoden beide Gütemaße wesentlich stär- 
ker schwanken als bei den adaptiven Verfahren. Analysiert man die Entwicklung 
der beiden Gütekriterien, ist festzustellen, daß mit steigendem Exponenten ß über 
den „Optimalwert“ die externe Validität aller Verfahren abnimmt bzw. konstant 
bleibt. Parallel nähern sich die Ergebnisse des exponentiell gewichteten Modells 
an die Befunde des First-Choice-Model an. Letzteres führt analog zur Prognose- 
validität bei allen Methoden zu verhältnismäßig geringer externer Validität. So- 
mit wiederholt sich das schlechte Abschneiden des First-Choice-Model bei der 
externen Validität. 

Das relative Abschneiden der Methoden zueinander wird auch an dieser Stelle bei 
allen alternativen Kaufverhaltensannahmen überprüft. Die Korrelation der Rang- 
plätze der Methoden ergibt, daß in nur 12% (Pearson) bzw. 3,4% (MAA) aller 
Fälle unterschiedliche Kaufverhaltensmodelle zum gleichen Ergebnis des Metho- 
denvergleichs fuhren. Um die Tatsache zu berücksichtigen, daß beide Gütekrite- 
rien teilweise nur marginal zwischen alternativen Kaufverhaltensmodellen 
schwanken, werden die entsprechenden paarweisen Vergleiche zudem anhand 
des Korrelationskoeffizienten nach Pearson gemessen. Als Grenzwert wird erneut 
eine Korrelation >0,9 herangezogen. In diesem Fall erhöht sich der Anteil an ver- 
gleichbaren Ergebnissen zwischen den Kaufverhaltensannahmen auf 54% (Pear- 
son) bzw. 42% (MAA). Dennoch wird deutlich, daß das Ausmaß der externen 
Validität und folglich auch der Verfahrensvergleich von der Wahl der Kaufver- 
haltensannahme beeinflußt wird. 

5.4.4 Zusammenfassung der Ergebnisse hinsichtlich der externen 
Validität 

Zur Überprüfung der externen Validität sind die Prognoseergebnisse der Con- 
joint-Interviews auf die reale Marktsituation übertragen worden. Auf Basis eines 
Marktanteilsmodells wurden die Marktanteile für 4 verschiedene Marken progno- 
stiziert, wobei über die Kaufwahrscheinlichkeiten für die Marken hinaus ver- 
schiedene Marketing-Mix-Instrumente in das Modell eingingen. Als Vergleichs- 
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große dienten reale Marktanteilsdaten des GfK-Handelspanel. Wesentliche Er- 
gebnisse der externen Validitätsprüfung sind: 

1. Hinsichtlich beider Gütekriterien der externen Validität schneiden die neuen 
Verfahren CCC-neu und CHIC-neu am besten ab. Nur bei diesen beiden Ver- 
fahren ergibt sich eine schwach signifikante Korrelation zwischen beobach- 
teten und prognostizierten Marktanteilen. Die Überlegenheit der beiden neuen 
Methoden kann folglich zumindest indirekt als (schwach) signifikant inter- 
pretiert werden. Alle anderen Methoden weisen eine geringere externe Vali- 
dität auf, wobei sich bei den drei Self-Explicated-Methoden die geringste 
Übereinstimmung zwischen prognostizierten und realen Marktanteilen ergibt. 
Auffallend hierbei ist, daß auch die Unterschiede der Self-Explicated- 
Methoden zur ACA, CCC-alt und CHIC-alt überraschend gering ausfallen. 

2. Der Wahl der Kaufverhaltensannahme kommt bei der Prognose realer Markt- 
anteile eine zentrale Bedeutung zu. Es zeigt sich, daß sowohl die absolute 
Höhe der externen Validität als auch das relative Abschneiden der Verfahren 
zueinander und dadurch das Ergebnis des Methodenvergleichs von der Wahl 
der Kaufverhaltensannahme beeinflußt wird. 

3. Im Vergleich zu den Befunden der Prognosevalidität ergibt sich für die Er- 
gebnisse der externen Validität eine wesentlich höhere Konsistenz sowohl 
zwischen den beiden Operationalisierungen des Validitätsmaßes (Pearson und 
MAA) als auch hinsichtlich der beiden neuen Berechnungsformeln für die 
CCC und die CHIC. 

Die relativ guten Ergebnisse in ihrer absoluten Höhe dürfen an dieser Stelle aller- 
dings nicht über die grundsätzliche Problematik hinwegtäuschen, die mit der 
Übertragung der Ergebnisse der Conjoint-Befragung auf die reale Marktsituation 
verbunden ist. Auch wenn Informationen hinsichtlich verschiedener Marketing- 
Instrumente in dem Marktanteilsmodell integriert wurden, können nicht alle ex- 
ternen Einflüsse auf Konsumenten in der realen Kaufsituation und auf das ge- 
samte Marktgeschehen berücksichtigt werden. Da sich diese Nichtbeachtung je- 
doch in gleicher Weise auf alle Methoden auswirkt, werden die Aussagen über 
das relative Abschneiden der Methoden nur bedingt eingeschränkt und können 
zumindest in ihrer Tendenz bestehen bleiben. 
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5.5 Diskussion der empirischen Ergebnisse 

Der empirische Validitätsvergleich der untersuchten 8 Methoden wurde anhand 
verschiedener Gütemaße vorgenommen. Die Ergebnisse hierzu sind in den vor- 
angegangenen Kapiteln jeweils separat diskutiert worden. Für eine abschließende 
Bewertung der Methoden werden im folgenden alle Validitätsmaße und deren 
alternative Operationalisierungen gemeinsam betrachtet. Zu diesem Zweck sind 
alle Ergebnisse in Tabelle 5-18 noch einmal zusammenfassend dargestellt. Bei 
der Prognosevalidität und der externen Validität ist jeweils das Verfahren hervor- 
gehoben, welches bei entsprechender Operationalisierung die höchste Validität 
aufweist. 
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Tabelle 5-18: Gegenüberstellung der Ergebnisse aller betrachteten Gütemaße 



Unter- 

schiede 


sig. 


c/5 

d 


k.A. 


c/ö 

d 


n.s. 


bedingt 

sig. 


1 


bedingt 

sig. 


1 


U 

HH 

u 

1 

u 

C/5 


• keine Unterschiede zwischen identischen Methoden (SE-CCC und SE-CHIC) 

• signifikante Unterschiede zwischen allen unterschiedlichen Verfahren 


• auf aggregierter Ebene (Mittelwerte) nur in Ausnahmefällen Unterschiede zwischen 
den Verfahren 


nicht getestet 


41,5 


0,29 


0,75 




0,84 


uT 


u 

U 

U 


39,7 


0,28 


0,79 


6,1 


0,83 




SE-ACA 


40,2 


0,28 


0,48 


(N 

r-" 


0,82 


wT 


CHIC- 

neu 


0,79 

(Pearson) 


0,82 

(Pearson) 


44,9 


0,27 


0,80 


4,3 


0,93* 


3,9 


CHIC- 

alt 


CO 

aC 


0,26 


0,82* 


4,3 


0,88 




CCC- 

neu 


0,77 

(Kendall) 


0,68 

(Kendall) 


41,3 


0,33 


■a 

o^ 

00 

o 


6,5 


0,94* 


3,8 


CCC- 

alt 


44,2 


0,33 


0,79 


5,5 


0,88 


4,4 


ACA 




0,62 

(Pearson) 


45,4 


0,32 


0,64 




0,87 


00 


Gütemaße und 

deren Operationalisierungen 


individuell 


aggregiert 


Conjoint-Phase 


Kombinationsphase 


First-Hit- 
Rate (%) 


Kendalls t 


Pearson 


MAA (%) 




Pearson 


MAA (%) 


Bedeu- 

tungs- 

gewichte 


indivi- 

duell 


aggre- 

giert 


Diskrimi- 

nierende 

Validität 


Interne 

Validität 


Prognose- 

validität 


Externe 

Validität 
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sig.: signifikant; n.s.: nicht signifikant; k.A.: keine Aussage möglich; * p<0,l; ** p<0,05 










Faßt man die Befunde der empirischen Validitätsprüfung über alle Kriterien aus 
Tabelle 5-18 zusammen, können drei zentrale Ergebnisse festgehalten werden: 

1. Die beiden neu entwickelten Verfahren CCC und CHIC erweisen sich auf 
Basis der vorliegenden Untersuchung als geeignete Methoden zur Präferenz- 
messung. Sie schneiden mit einer nicht signifikanten Ausnahme bei der First- 
Hit-Rate bei allen betrachteten Gütekriterien gleich gut, im überwiegenden 
Teil sogar besser ab als das etablierte Verfahren ACA. 

2. Als zweites Ergebnis zeigt sich, daß trotz signifikanter Unterschiede zwischen 
den ermittelten Präferenzstrukturen auf individueller Ebene (vgl. die Ergeb- 
nisse zur diskriminierenden Validität), die Unterschiede zwischen den Metho- 
den hinsichtlich ihrer Prognosegüte nur verhältnismäßig gering ausfallen. 
Während die Unterschiede auf individueller Ebene zwischen allen Verfahren 
nicht signifikant sind, weisen die beiden neuen Verfahren CCC und CHIC bei 
aggregierter Analyse eine schwach signifikante Überlegenheit gegenüber der 
ACA auf, was indirekt über die Korrelationskoeffizienten nach Pearson gete- 
stet wurde. Dies gilt sowohl für die Messung der Prognosegüte anhand eines 
Holdout-Sets als auch bei der Prognose realer Marktdaten. 

3. Die unter Punkt 2 angeführten geringen Unterschiede zwischen den Verfahren 
treten nicht nur im Vergleich der adaptiven hybriden Verfahren untereinander, 
sondern ebenso gegenüber den untersuchten Self-Explicated-Varianten auf 
Damit schneidet die Self-Explicated-Methode in der vorliegenden Untersu- 
chung gegenüber allen drei adaptiven hybriden Methoden gut ab. 

Wie bei jeder empirischen Studie sind der Interpretation dieser Ergebnisse Gren- 
zen gesetzt. Hinsichtlich der angewendeten Gütekriterien muß bei der internen 
Validität darauf hingewiesen werden, daß die angegebenen Gütemaße in ihrer 
absoluten Höhe nicht direkt miteinander vergleichbar sind. Dementsprechend ist 
ein Test auf Signifikanz der Unterschiede nicht möglich (vgl. letze Spalte in Ta- 
belle 5-18). Für die Self-Explicated-Verfahren ist die interne Validität nicht ex- 
plizit getestet worden, da die in Tabelle 5-5 ausgewiesenen Werte eher einer 
Überprüfung der Prognosevalidität und nicht der internen Validität entsprechen. 
Eine Aussage über das relative Abschneiden der Verfahren kann auf Basis der 
internen Validität folglich nicht abgeleitet werden. Der Aussagegehalt der Ergeb- 
nisse in bezug auf die Prognosevalidität wird zumindest teilweise dadurch ein- 
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geschränkt, daß die Prognose der simulierten Kaufentscheidung insgesamt nur 
unzureichend gelingt. Die sehr niedrigen Werte für die First-Hit-Rate und die 
durchschnittlichen Kendalls x-Werte auf individueller Ebene bei allen Methoden 
deuten daraufhin, daß starke Reliabilitätsprobleme in den Antworten der Proban- 
den oder gar Fehler in der Datenerhebung zu vermuten sind. Weiterhin muß be- 
rücksichtigt werden, daß, obgleich eine verhältnismäßig große Stichprobe befragt 
wurde, vor allem hinsichtlich der externen Validität nicht ohne weiteres sicher- 
gestellt werden kann, daß diese repräsentativ fiir einen Vergleich mit den realen 
Marktdaten des GfK-Handelspanel ist. Ferner wurde in dieser Untersuchung le- 
diglich eine Produktart mit einer bestimmten Anzahl an Eigenschaften be- 
trachtet. Wenn auch in dem vorgenommenen Literaturüberblick über bisherige 
Vergleichsstudien in Kapitel 2 keine systematischen Einflüsse dieser Merkmale 
einer Studie aufgezeigt werden konnten, kann nicht davon ausgegangenen wer- 
den, daß die vorliegenden Ergebnisse auf andere Untersuchungsgegenstände ohne 
weiteres übertragbar sind. 

Trotz dieser Einschränkungen ermutigen die vorliegenden Befunde, die beiden 
neuen Verfahren im Rahmen weiterer Untersuchungen dahingehend zu überprü- 
fen, ob sie für alternative Fragestellungen ebenso zufriedenstellende Ergebnisse 
liefern. Für weitere Untersuchungen sei gleichzeitig empfohlen, trotz des zusätz- 
lichen Erhebungsaufwands eine explizite Überprüfung der Reliabilität in den In- 
terviewablauf zu integrieren. Dann können Verzerrungen der Prognoseergebnisse 
aufgrund fehlender Reliabilität identifiziert und die beiden Effekte bei der Ergeb- 
nisinterpretation getrennt werden. 
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6 Fazit der Arbeit 

Während kein Zweifel darüber besteht, daß Kenntnisse über die Präferenzstruktu- 
ren der Nachfrager von zentraler Bedeutung für ein erfolgreiches Produkt- 
Management sind, gibt es bisher kein Verfahren, das für deren Messung eindeutig 
empfohlen werden kann. Der vorgenommene Literaturüberblick über empirische 
Validitätsvergleiche führte zu dem Ergebnis, daß sich keine Variante der Con- 
joint- Analyse, der Self-Explicated-Methode oder der hybriden Verfahren als ein- 
deutig überlegen erwies. Insbesondere für die Adaptive Conjoint Analysis 
(ACA), die sich mittlerweile als Standardverfahren zur Präferenzmessung eta- 
bliert hat, konnte gezeigt werden, daß sie in zahlreichen Studien schlechter als die 
verglichenen Methoden abschneidet. 

Vor diesem Hintergrund war ein Ziel der vorliegenden Arbeit, neue computerge- 
stützte Conjoint- Varianten zu entwickeln. Motivation für die Entwicklung der 
neuen Verfahren waren vornehmlich zwei Gründe. Erstens wirft das relativ 
schlechte Abschneiden der ACA bei empirischen Vergleichen sowohl gegenüber 
der rein dekompositioneilen Conjoint- Analyse als auch der Self-Explicated- 
Methode vor allem die Frage auf, ob methodische Schwächen des Verfahrens 
dafür verantwortlich sind. Zweitens wird mit den neuen Methoden der Vielfalt 
dekompositioneller Varianten auch im Bereich computergestützter hybrider Me- 
thoden Rechnung getragen, wobei neuere Entwicklungen wie die Choice-Based 
Conjoint Analysis integriert wurden. Mit der Customized Computerized Conjoint 
Analysis (CCC) und der Choice-Oriented Individualized Conjoint Analysis 
(CHIC) wurden zwei computergestützte hybride Verfahren zur Präferenzmessung 
vorgestellt, die sich wie die ACA durch einen individualisierten Interviewablauf 
auszeichnen. Sie sind dadurch auch für Anwendungen mit vielen Eigenschaften 
geeignet und werden so einer wichtigen Anforderung der Praxis gerecht. 

Über die Entwicklung der neuen Methoden hinaus war ein zweites Ziel der Ar- 
beit, die praktische Anwendbarkeit der neuen Verfahren zu überprüfen. In einer 
umfassenden empirischen Studie mit einer Stichprobe von 748 Probanden wurde 
eine vergleichende Validitätsprüfung vorgenommen. Als Referenzgrößen für die 
Ergebnisgüte der CCC und der CHIC wurden zum einen die ACA als am häufig- 
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sten eingesetztes Verfahren und zum anderen die Self-Explicated-Methode her- 
angezogen. Letztgenannter konnte in bisherigen empirischen Vergleichsstudien 
eine vergleichbare Prognosegüte wie den Conjoint- Varianten bescheinigt werden. 

Die empirische Überprüfung der untersuchten Methoden erfolgte anhand ver- 
schiedener Gütekriterien. In einem ersten Schritt wurde mit der diskriminierenden 
Validität getestet, ob die verschiedenen Methoden zur Präferenzmessung zu un- 
terschiedlichen Ergebnissen in den geschätzten Präferenzstrukturen fuhren. Da 
dies der Fall war, wurde mit der internen Validität die Modellgüte der Verfahren 
an sich überprüft und auf Basis einer simulierten Kaufentscheidung die Progno- 
sevalidität der Verfahren verglichen. Eine Besonderheit der vorliegenden Unter- 
suchung liegt in der Überprüfung der externen Validität durch Prognose der rea- 
len Marktanteile für die untersuchten Marken. 

Als ein zentrales Ergebnis der empirischen Studie kann festgehalten werden, daß 
die beiden neuen Verfahren CCC und CHIC hinsichtlich der angewendeten Gü- 
temaße zu wenigstens gleich guten, teilweise sogar besseren Prognoseergebnissen 
fuhren als das etablierte Verfahren ACA. Betrachtet man das in der Praxis am 
häufigsten eingesetzte Verfahren als Referenzgröße, erweisen sich die neu ent- 
wickelten Verfahren als geeignete Methoden zur Präferenzmessung. Die teilweise 
geringen Unterschiede in den Ergebnissen geben aber noch keine klare Antwort 
auf die Frage, ob die Schwachstellen der ACA durch die alternativen Vorge- 
hensweisen der CCC und der CHIC behoben werden. Die vorliegenden Befunde 
deuten zwar tendenziell darauf hin, aber erst weitere Studien müssen zeigen, ob 
sich die Ergebnisse stabilisieren. 

Ein zweites, vor allem unter Anwendungsgesichtspunkten wichtiges Ergebnis 
resultiert aus den guten empirischen Befunden für die Self-Explicated-Methode. 
Die jeweils separate Auswertung der Daten nach der ersten Interviewphase, dem 
kompositioneilen Befragungsteil, führte in der vorliegenden Studie gegenüber 
allen drei adaptiven Verfahren zu vergleichbaren Prognoseergebnissen. Diese 
Befunde sind vor allem für die praktische Anwendung in der Marktforschung von 
besonderem Interesse. Die Implementierung der Self-Explicated-Methode zur 
Präferenzmessung ist wesentlich einfacher als ein Conjoint-Interview. Ein damit 
verbundener Vorteil des Verfahrens besteht in der Einsatzmöglichkeit von Tele- 
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foninterviews, was im Rahmen der Conjoint- Analyse immer wieder gewünscht 
wird, in der Praxis jedoch nur sehr eingeschränkt durchführbar ist. 

Zusammenfassend muß angesichts dieser Ergebnisse die eindeutige Dominanz 
der ACA in der praktischen Anwendung kritisch hinterfragt werden. Die vorlie- 
gende Arbeit liefert zum einen neue adaptive Verfahren, die genauso gut, teilwei- 
se sogar besser geeignet sind, die Präferenzstrukturen von Nachfragern zu mes- 
sen. Zum anderen stellt die Self-Explicated-Methode ein alternatives Verfahren 
zur Präferenzmessung dar, das aufgrund von Zeit- und Kostenvorteilen unter 
Anwendungsgesichtspunkten allen Conjoint- Varianten überlegen ist. 
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7 Anhang 



7.1 Bildschirmausdrucke des CCC-Interviews*‘" 

Begrüßungsbildschirm 




Guten Tag, vielen Dank, daK Sie sich bereit arklMrl heben, an dleaar Studie laltrunehmen und 
einige Pregen zu beamwarten. Dal dleear Studie geht es heuptettchTIcIi um KUhlechrllntca. 



Die Studie wird In Zueammenerbell mit dem Unllevar Stlflungelehisiuhl der BnFveraltllt Jena und 
dam MarktTerachungetnstMut GrM.GETAS/WBA durch geführt Wir veralchern Ihnen, defl die Unter* 
euchungsergehnNee vbh urt« streng vertreultch behandelt und nie ln Verbindung mit dum Hetnen 
■ uegewertet, sondern nur In Form von rueummenfAsaenden SinHsilken dargeetallt werden. 

Da« Interview Ist ea sufgebaut daK Sie Im ersten Teil selbst am Bildschirm sitzen und die Fragen 
mit der Maus und der Testatur beantworten. Im zwoMun Teil der Defragung wird der Intervtewur 
den Cemputer bedlenan. SelbetvaratHndllch steht der Interviewer fUr RUckfragan oder 
Hilfestellungen zur Verfügung. 




Hinweisbildschirm zur Bedienung des Programms 




Bevor wir mit den einzelnen Fragen beginnen, hier noch cfnzalee "technische" Hinweise: 



Einige Fragen verlangen* daß Sie NJr Ihre Antwort eine Ziffer eingeben, fClIcken Sie ln 
dleeem Fall mit der Matis zunHchst In das Kisteben* In das Sie die enteprechende Ziffer 
schreiben mHchten. Benützen Sie bitte dann die ZIHer-Tsstefi oben auf der Tantatur und 
tragen Sie die enteprechende Ziffer ein. 

Einige Fragen erfordern, dafi Sk ganze Worte tippen. TIppeit Sie dann ekfftch so, ala wenn 
Sie einen Brief echrelben. 

Um Im Interview lewe II* fortzufohren* klicken Slo hIHe aut dert “Welte r*''Bunon. 




Es sei darauf hingewiesen, daß die einzelnen Befragungsschritte bei allen drei Interviews 
jeweils exemplarisch anhand eines Beispiels und nicht für alle Eigenschaften bzw. alle Ei- 
genschaftskombinationen in der Conjoint- bzw. Kombinationsphase dargestellt werden. 
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Self-Explicated-Phase 



Hinweisbildschirm 




Wflr mHcMan Von Ihnan arfaliriDn, wlo wichtig dlo rigsmchafton Mario, 

Cnvrglwfrt brauch, Stoma daa Gafrlarfacht, Praia, Kuttlnhalt, Abioumtigllchkolt, 
Garantie und Innetiaueilattung fUr Sie balm Kauf alnta KUhhtchrsn1<« alnd. 



Im folgaedon Eelgen wir Ihnen datu die«» ElganfcKaften ur>d deren Auapregungan. 
dia Sta Jewall« beurteilen tollen. 

Gehen Sie bltia Im Verlauf d»e flsaamten Interviewe Immer davon tue, daft Oaitch um 
einen FCKW- und FKW4^raten Kuhlachrenlt mit Gefrierfach handelt, 
ttae weiteren wateljader Küfiltchrank die AuKenniftHe Hdhe/Hrella/Tlare 
Qücm^SlIcmiSacm auf und l*t ein- biw. unlerbeufafilg. 



Bewertung der Eigenschaftsausprägungen: 

Identifikation der besten und schlechtesten Ausprägung 

Dieser Befragungsschritt entfiel für die quantitativen Eigenschaften Preis, 
Energieverbrauch, Garantie und Nutzinhalt. 



Ualfrn I rljtt(gni) 1 



Welche der folgenden AueprUgifnoen bei der Eigene che fl: MarVe 

würde Itinen am betten gefelletr und welche würde ihnen am wenigeten gefallen, eofem alle 
anderen ElgenachnHen gleich sind? 

Schreiben Sie bitte lewellb die entep rechende Murnrnerder zutreffenden AuoptHgung In daa 
dafUr vorgeaehene KHatchen. 




Am beete IV wUrde mir 
gefallen Nr. ... 

Am wenigsten würde mir 
gefallen Nr. ... 



Weiter 
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Bewertung der Eigenschaftsausprägungen: 

Bewertung der mittleren Ausprägung anhand einer 1 1-Punkte-Rating- Skala 
bei der die beste und die schlechteste Ausprägung als Endpole der Skala 
ausgewiesen sind. 



Daten LrloiiuKHi Maike 3 PVRCl: 



SM sehen hier efne SKele von 1d Wt 0, Debet wur ne der 10 die nueprflguny ?uQecritnflt, die tmen em liestsn 
gef Vien wurden Der AufprnounSi die ihnen mri wenigsten gvf allen wttrde, Ist der wert 0 Eirgeordnet worden. 
Auch hier gM JbwbIIb, daft eile anderen rfgenschdTten glefch sind. 

Bitte heurlenen Ste |elTt die ührlgen AirsprignnirBii, Vnlem Sie Ihnen ptnen Werl aut der Skala rcuerrfnen. Je 
hühar der Wert ist, deste beseer trelUffi ihnen diese Ausprägung. 

Dsbe) darf Jeder Wirt mir etimst vergeben Wer denl 

BItf e tragen Sie den SMienwert neben die Auaprbgung ln das dafLIr vorgaeehende Kistchen In der enten- 
clehenden Tahena ebi. 



lll q] e— 7 4 3 — 

gefitit rn1r am bialan 
Ouella TrMlag 


Z— 1 0 

gaOMrt mir sm winlgslen 
Liebharr 


Ifr. AiMrprB*gUi>gan SsUrlaHungavffrft 


Eloanschafi: 


1 Shimen« | 


MarKe 


i irtun 




i 


Weiter | 


Erfassung der Wichtigkeiten für die Eigenschaften: 



1 . Frage nach der wichtigsten Eigenschaft (10 Punkte) 

2. Vergabe eines Punktwertes von 0 bis 10 Punkte für die übrigen Eigen- 
schaften unter Verwendung der wichtigsten Eigenschaft als Ankergröße 



Damn frlattvnq 4 WRl 



äls sehen indsrunlanatthendanTibslls tllt Elgsnschatten mil derjswells lOr Sie bestan und echiartiteaian 
Aua pr« gu ng . Wir mdebian ga ma von mnan ■ ifv hren, wi e wicniig o i« ta E i gi na chaitan fOr G l a aln d. 
eine wdniert Sie blerfbr zuritcnat dia Eigen ec hatl aus. dla lOr Sie am v^&httgeian ist und ordnen dratar Elgenschsft 
den Wed 1 0 zu. Dia wlchUgtls Elgantchsn loUts also ditjeniga laln, bei derihflan die Verbteaarung von dar 
acblachtailan Ausprägung zur faasttn Ausprägung am wadvotralan laL ' 

Sitte bsurtalisn SIs anschltaasnd dia anderen ElgsnschsHen Im Vergiakh dazu. OrdnsnSfe ihnen bitte einen Werl 
zwfschtn 0 und t D zu. Ja hOhar dsr Wert Ist den Sie zuordnsn, daslo wlchUger Ist Ihnen dit Elganscrhaft. 

Sofern Ihnen varaUiledene Eigens Charten gfelcbwlcbirg sind, können Sie diesen dla gialchsn Werte zutilfen. 
Tragen 81« dis Werts blHe ln die ratzt# Eptite darttbelfe sin 



Hr. 


ErgsntehsfTen 


■ chTeerrisate Ausprsguno 


basta Auspfffluno WicMigheA 


4 


Ntarks 


Lbebliarr 


CHjalla PrlaHaa 


2 


E nar qIb V Bf br *uc h 


214 kwffi pr n JbIw 


1«S liVWi prv Jahr 


] 


Sterm da* Cvhlarfteha 


'.Fach M *CJ 


*«-FKbM**C) 


4 ^ 


Praia 


44S.- OM 


44S,- PM 


S 


HutxmiMa 


11S LHar Hul^lnhaH 


1« LRar HulzInnaH 


a 


Alvtaurn4gllGnkan 


Abtauung «an Hand 


Abtau ' Amofnatlta Im HuhKaP 


T . 


Carantla 


1 2 Monat o GaranU« 


24 MDuafa Cv anha 


a 


1 nna mua W an urm 


mnanauflDlIiaiii vormraaban 


KUhHsH und TUT frei gawlaHb 


Weller 



197 





Conjoint-Phase 



H i nweisb i I dschinTi mit Erläuterung der Conjoint-Aufgabc 



Sffl lehen gtalch fl vm tchlstlBn« KsTtsn, ifls unisricfilflcMcti* KtJtritclrrttnhfl ti«4Clit«flien- 
Gehmn Sla biHe bfsrbe^ vrledef dwiin >m. daft « ilcb »rmnor um strwn FCKW- und FKW-(YbIwi HUHathranh 
rhU GQttiQrfach handelt, öe« woderfln w«lvt |«der KUfriBctimrift die AuRenrnafls Mühad)rene/T1«fe 
flnctnQDctnaotm aurund Fti ein. biw. unterbauratiHi. 

Br4nQ«ii Sie dl« fl Ketlen bitte In die Reiheiirroiefl, In der Sie die Kuhfschrbnfla Knifen würden. On bedeutet, 
der rtsfig 1 wird dem KUblechrenK (üTH, der Karle) mgetirdnet, den Sie alc erclai kaufen nUrdert. 

Der Rang 2 wird dem KUtdarhrenk njgeef dhet, dan Sie an nvoher Stalle kaiUfen würden, U.d.W.. 



Hachdem Sie die Rdngefdr die otnrelmm Karten oingegDbeh haben, eracrtemen die fl Karten ki der Reihenralge, 
In der Sie die HUhisehrflnke am ehesten kaufen würden. Geben Sie denn bitts an, wie wafe ccbemiicfi ea wafe, j 
daR Sie diesen Kühlschrank tatsächlich kaufen würden, sofern Sie tnr der Kaufardscheldung stunden und j 
dieaer der reit erbannchwife. i 




Erfassung ganzheitlicher Präferenzen (1. Schritt): 

Angabe einer Präferenzrangfolge für 9 Produktalternativen, die durch 4 
individuell verschiedene Kcrncigenschaflen beschrieben sind. 



pi K^iilenliitc 0' 
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25 g hWhvm J«lv 


^50 kWh pte lütt 


Lub}tarr 


H 




Qu*U* PninUc 


G49,- QM 






4*9,- QU 


--F*thC-a 


■ 




'—.rieh Ml *C) 


|rKitr 1 i:d 


H 






' . 

SOQkWhpTtt Jütt 


Li«ri>i«TT 




EU< 1 k»Im 


QtmIW Pnvikf 


54?.. DU 










■ 






rKarlft/ 


|B 


r-i; .1 rl r: a 








Lttbru-ir 


|H 


EU-rttflVwf 


Pzinli« 




^ 4 ?.. DH 


|H 




549 . DH 




• r«:k(. 4 x:) 






^ r*f bt-6 X) 





Goben sie bRta m« Fteihanrciige efn, ht dar Sla die MUhlachr bhke kaufen würdeni 



Rang-N 1 


2 


a 


4 5 


G 


7 


a 


9 


n 


Karte nH B 


4 


7 


' 










I 
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Erfassung ganzheitlicher Präferenzen (2. Schritt): 

Angabe einer Kaufwahrscheinlichkeit von 0% bis 100% für jeden Rangplatz. 
Die Produktprofile sind jetzt entsprechend der angegebenen Präferenzrang- 
folge auf dem Bildschirm sortier t. 




Die beiden Beurteilungsaufgaben (Rangreihung und Kaufwahrscheinlich- 
keitsabfrage) werden in der Kombinationsphase für 9 weitere 
Produktprofile wiederholt. 




Bitte geben SEe den Laptop Jet2t an den Interviewer 2UfUek ..h. 




Alle weiteren erhobenen Zusatzdaten hinsichtlich der Probanden wurden bei allen 
drei Methoden (CCC, CHIC und ACA) von den Interviewern direkt eingegeben. 
Die entsprechenden Bildschirmausdrucke werden aus diesem Grund nicht mehr 
abgebildet. 
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1.2 Bildschirmausdrucke des CHIC-Interviews 



Die Self-Explicated-Phase der CHIC- Variante entspricht dem Vorgehen 
bei der CCC. Auf eine erneute Darstellung der identischen Bildschirmaus- 
drucke wurde daher verzichtet. 

Conjoint-Phase 



Hmvfoii 



99tnn QiiAich 4 vervchiCKtm» cta HUhitchMlnito ba#thre1bfltt. werdmi dam« 

tifliri HUiwtchrBr#; gustttviflhiai^ tfarr Sie *m ebäfften N«ifan tfthtien, torwn SM vor der 
KttifeiilBchflKfuiig vUmdan. I>imaf;h titttati wir St», ctl» UnterichM» zwischen den Kltilechf tfnhen 
zunächst mittels »Ener tOO Punkte-Shals und zuletzt anhand »IneB OM BvIraQi zu 1»werten. 



rdavHT bitarutAMlall UMlf ml» BivlarBn bh ulaj^af Knh 




Erfassung ganzheitlicher Präferenzen (1. Schritt): 

Auswahlentscheidung aus einem Choice-Set, bestehend aus 4 Produktalter- 
nativen und der Nicht-Kauf-Option. 



HHjEa 



Sie eehcn Klar verschiedene Kurten, die KUhlachrHiike heschrelbenl 
Gehen Sie bitte davon aue, daR alle anderen El^enachaflen, 
die hier nicht erscheinen bei alten Kithtschr Unken gfelcA sind. 

Welchen dieser Kühl sehr Unke wUrdeti Sie am ehesten kauten, 
wenn Sie vor der Kaufentscheidung stünden? 

Bitte klicken Sie eut die entapractiende Karte oder aut den unten stehenden Button I 









Wiederholte Auswahlentscheidung aus den verbliebenen 3 Produkt- 
alternativen 



WI=1B] 



Artgertommen. thnen stehen nur noch dleae 3 KifhtschrMnke zur Wühl. WHthen dieser 3 
KUhtschrHnke wUrden Sie dann um ehesten Icaulen? 

Bitte kllcicen Sie atitdle entsprechende Kartei 





|25€ kWh pM Jihr n 


1 


1 




|449.- DM 




I'-Fschfcn;) 1 


Kartei - - . . 

|>J0kWkp»:4hr 


. Karlen 1 

I^SlliWhpiDJtkr \ 




, ( 


Q‘ie!l» Rnvitoj 


iRkitmlia _j 


£45,. dm I 


DM 1. 




j--F«k(^'^ 1 



Entsprechende Auswahlentscheidung aus den letzten beiden Produkt- 
alternativen 

wiederum angenommen^ Ihnen stellen nur nach diese 2 KühlsthrKnlte zurAtiiwahl. 

Wetchen dieser 2 Kilhlschritnke wUrden Sie dann am ehesten kaufen? 

Qltte kticken Ste auf die entsprechende Kartei 

, Karteg M 

|250kmpm Jiiu I 

jl^tfTrjrn 

(1^19, DM 

Karte 4 I 

p^kWhpiu JiKr — — | 

[Elw’lrptm 

DM 

(■^hC-TO 
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Hinweisbildschirm mit Erläuterung der folgenden Aufgabe 



Im folg:end«n ivtisn S\m fiocK einmal die eben beurteilten 4 Kuhlfchrinke« Debel elnd die ! 
Kuhlech rbnken In die Relhenretge gebracht werden, In der Sie sich dafür 
entechelden würden. 

Dem Kuh lech rank, den Sie i>H ert1»> autgewIlhK haben, wurde auf einer 100 Punlde-Skale 
der höchst« Weh 100 rugeerdnet. Dem Kühlschrank, fUr den STe sich als leltias entBchleden 
haben, wird dar Werl 0 lugeurdnet. Wir müchten gerne, daft Sie die darwischan Magandan 
KUhltchranke tm Vergleich lu diesen beiden beurteilen. Ordnen Sie hierfür blne Jedem 
Kühlschrank alnen Wert zwischen 0 und 1130 zu, Je fiüher der Werli desto eher würden Sie 
sich für einen Kühlschrank entscheiden. 



M/«lter 



2. Schritt: 

Quantifizierung der Präferenz-Unterschiede anhand einer 100-Punkte-Skala 
Die Produktprofile sind jetzt in der ausgewählten Reihenfolge abgebildet 




\S4^.. DM 



IUbWh|p»j4hr 



349, DH 
250 km pm 



mj Punkte 



|sy Punkte 



{SitfMJU 



h-*+-r«h(-i8 ’C) 



Tragen Sie den erZanrectienden faCte dei KAatcrwi ein ednr varkven 
Sie i*a PieiHewefte mste^ fler Pre»e neuen cJwn lewengen KSncuen, 
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Karted — 0 



Weller | 



202 









3. Schritt: 

Transformation der Präferenz-Unterschiede in eine monetäre Größe 



Bmt dar varnngagBhgvnan BeuiialFung hahan S|a den llnki stnhandfl Kuhtachrank gaganiibar 
dein raehttn KdhTtchrank vorgeEogan. Wir mbtMan jeti* gartia van Ihnan wtsaarr, 
wie stark Sla den llnkan Kuhltclirank gaganUhar dam rachlan havorEugntiK 
Gaban Sla dafür bitte atti wievlol der rachta Kühlachrank Fntgesamt gUnttlgar als dar llnka 
Kühlschrank aal n müRta^ damit beide KUhtschrdnka für Sla glalch snrakHvsInd. 

Tragen Sie den DM.Batrag bitte In das unten dafür vorgeaabana Hbaichan aln. 



DM 



DM 



ISQ kWh piQ J4hr 



Ekel IO ha 



■*.F«h MS*C> 



l^kWhpioJ^ 



Ele^lnslujt 






Der rai:bta Hühlachrank mUAle tnegaaamt | | DM güntllger eli 

der llnka Kühlschrank aaln, damit ate beide glardi attraktiv für mfeh sind. 

gelter I 



Diese 3 Befragungsschritte werden für jedes zu bewertende Choice-Set der Con- 
joint-Phase sowie für ein zusätzliches für die Kombinationsphase wiederholt. 

Die Anzahl der insgesamt zu bewertenden Choice-Sets wird von dem Programm 
in Abhängigkeit der individuellen Kerneigenschaften und deren Ausprägungen 
festgelegt. 

Nach Bewertung aller Choice-Sets werden die Probanden entsprechend dem 
Vorgehen bei der CCC gebeten, den Laptop wieder an den Interviewer zu über- 
geben, der alle weiteren Zusatzdaten hinsichtlich der befragten Person direkt ein- 
gibt. 
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